要旨: 現代の生成モデルによって生成されるディープフェイクは、情報の完全性、デジタル・アイデンティティ、公的な信頼に対して深刻な脅威をもたらします。既存の検出手法は主として事後対応的であり、操作が起きた後にそれを特定しようとするものの、生成技術が進化するにつれて一般化できないことが多いです。これにより、生成の時点でメディアの真正性を確保するための、先回り型(プロアクティブ)な仕組みの必要性が明確になります。本研究では、先回り型ディープフェイク防御とメディア出自(プロベナンス)検証のための、Source-Attributed Invisible watermarking Framework(SAiW)を提案します。従来のウォーターマーキング手法がウォーターマークのペイロードを汎用的な信号として扱うのに対し、SAiWはウォーターマークの埋め込みを、出所に条件付けされた表現学習問題として定式化します。ここでは、ウォーターマークのアイデンティティが、発信元の出所を符号化し、埋め込みプロセスを変調することで、識別可能で追跡可能な署名を生成します。この枠組みは、特徴ごとの線形変調を埋め込みネットワークに導入し、スケーラブルな多出所ウォーターマーク生成を可能にします。さらに、人間の視覚系に関する事前知識に基づくパーセプチュアル(知覚)ガイダンスモジュールにより、ウォーターマークの擾乱が視覚的に知覚できないままであることを保証しつつ、頑健性を維持します。加えて、二重目的のフォレンジックデコーダが埋め込まれたウォーターマークを同時に再構成し、出所推定(ソース・アトリビューション)も行います。これにより、自動的な検証と、解釈可能なフォレンジック証拠の両方が得られます。複数のディープフェイクデータセットにわたる大規模な実験の結果、SAiWは高い知覚品質を達成しつつ、圧縮、フィルタリング、ノイズ、幾何変換、敵対的擾乱に対して強い頑健性を維持することが示されました。不可視でありながら検証可能なマーカーによってデジタルメディアをその出所に結び付けることで、SAiWは信頼性の高い認証と出所推定を可能にし、先回り型ディープフェイク防御と信頼できるメディア出自に向けた、スケーラブルな基盤を提供します。
SAiW: ソース帰属可能な不可視ウォーターマーキングによる先回り型ディープフェイク防御
arXiv cs.AI / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、生成時点でメディアの来歴(プロベナンス)を検証するための、ソース帰属可能な不可視ウォーターマーキングを用いた先回り型ディープフェイク防御手法SAiWを提案する。
- SAiWは、ウォーターマークの埋め込みをソース条件付きの表現学習問題として扱い、ウォーターマークのアイデンティティを埋め込みにより変調することで、複数のソースにまたがって署名が識別可能かつ追跡可能な状態を維持する。
- 人間の視覚系に関する事前知識に基づく知覚ガイダンス・モジュールを用いて、ウォーターマークの摂動を視覚的に知覚不能なままに保ちつつ、頑健性を保持する。
- 二重用途のフォレンジック・デコーダはウォーターマークを再構成し、ソース帰属(アトリビューション)も実行する。自動検証と、解釈可能なフォレンジック証拠の両方を提供することを目的としている。
- 複数のディープフェイク・データセットにわたる実験により、(圧縮、フィルタリング、ノイズ、幾何学的変換、敵対的摂動といった)一般的な実環境の変換や攻撃に対して高い頑健性を示しつつ、知覚品質も高く維持できることが確認された。
