潜在整合ブリッジを介した凍結拡散モデル間の転送可能なマルチビット透かし埋め込み
arXiv cs.CV / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、完全に凍結した拡散画像生成器に対してプラグアンドプレイで動作する透かし埋め込み手法DiffMarkを提案し、各ノイズ除去ステップに永続的に学習された微小摂動を追加することで実現する。
- DiffMarkは、最終的に復元された潜在表現(z0)に透かし信号を蓄積することで、従来のサンプリングベース手法で必要だった高コストのNステップDDIM反転を回避し、シングルパスでのマルチビット検出を可能にする。
- 凍結したUNetを通した学習を現実的にするために、本手法では微分可能なブリッジとしてLatent Consistency Models(LCM)を用い、勾配ステップ数を約50のDDIMステップから4つのLCMステップへ削減する。
- 著者らは、シングルパス検出が約16.4 msで実行できるなど大幅な速度向上(約45倍のゲイン)を報告しており、さらに、画像ごとの秘密鍵や、各アーキテクチャごとに再学習することなく行えるクロスモデル転送可能性にも対応する。
- 本アプローチは、歪み・再生成・敵対的攻撃に対して競争力のある堅牢性を維持しつつ、未見の拡散系アーキテクチャへも転送可能であると主張している。
