改ざん耐性のある汎用ウォーターマーキングによる高忠実度な顔コンテンツ復元

arXiv cs.CV / 2026/3/26

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、AIGCによる顔操作やディープフェイクに対して耐改ざん性を備えつつ、フォレンジックに有用な情報を保持することを目的とした、改ざん耐性のある汎用ウォーターマーキング枠組み「VeriFi」を提案する。
  • 従来の手法が、明示的なローカリゼーション・ペイロードを埋め込むことで(忠実度と機能性のトレードオフを生みつつ)対応していたのに対し、VeriFiはコンパクトなセマンティック潜在ウォーターマークを埋め込むことで、大きな編集の後でも高忠実度なピクセルレベルの顔コンテンツ復元を可能にする。
  • 画像特徴とデコードされた出自(provenance)信号を相関させることで、ローカリゼーション固有の視覚的アーティファクトを追加せずに、きめ細かな操作のローカリゼーションを実現する。
  • 実環境でのディープフェイク生成に対する頑健性を高めるため、VeriFiは潜在空間での混合とシームレスなブレンディングを用いたAIGC攻撃シミュレータを追加する。
  • CelebA-HQおよびFFHQでの実験により、VeriFiはディープフェイク・フォレンジックにおいて、ウォーターマーク頑健性、ローカリゼーション精度、復元品質のいずれの点でもベースラインを上回ることが示される。

Abstract

AIGC による顔の操作やディープフェイクの拡散は、メディアの出所性、完全性、ならびに著作権保護に対して深刻な脅威をもたらします。従来の汎用的な透かし(ウォーターマーキング)システムは、典型的に、明示的なローカライゼーション用ペイロードを埋め込むことに依存しており、これにより「忠実性—機能性」のトレードオフが生じます。すなわち、ローカライゼーション信号を大きくすると視覚品質が劣化し、また強力な生成的編集の下ではデコードの頑健性が低下することがよくあります。さらに、既存手法は内容の復元(コンテンツ・リカバリ)をほとんど支援しておらず、元の証拠を再構築する必要がある場合の法医学的価値が制限されています。これらの課題に対処するために、我々は VeriFi を提案します。VeriFi は、著作権保護、画素レベルの操作位置(ローカライゼーション)、および高忠実度の顔コンテンツ復元を統合する汎用的なウォーターマーキングの枠組みです。VeriFi は次の 3 つの主要な貢献を行います。(1)内容を保持する事前情報として機能する、コンパクトな意味論的潜在(セマンティック・レイテン)ウォーターマークを埋め込みます。これにより、重大な操作の後でも忠実な復元が可能になります。(2)画像特徴とデコードされた出所(プロベナンス)信号との相関により、ローカライゼーションに特化したアーティファクトを埋め込むことなく微細なローカライゼーションを実現します。(3)潜在空間での混合と、シームレスなブレンディングを組み合わせた AIGC 攻撃シミュレータを導入し、現実的なディープフェイクのパイプラインに対する頑健性を高めます。CelebA-HQ および FFHQ に対する広範な実験により、VeriFi はウォーターマークの頑健性、ローカライゼーション精度、および復元品質のいずれの面でも、強力なベースラインを一貫して上回ることが示されました。これにより、ディープフェイクのフォレンジックに対して実用的かつ検証可能な防御策を提供します。