要約: ディープフェイク技術の急速な進化は、ソーシャルネットワークにおいて短いループの時間的メディアを代表するGraphics Interchange Format(GIF)画像の真正性に、前例のない脅威をもたらしています。 しかし、既存の先行型フォレンジック手法は静止画像向けに設計されているため、アニメーションGIFへの適用には限界があります。 このギャップを埋めるために、本研究では、GIFにおけるディープフェイク先行型フォレンジックのために特化した、最初の時空間ウォーターマーキング枠組みであるGIFGuardを提案します。 埋め込み段階では、高レベルな意味的改ざんに対する頑健性を確保するためのSpatiotemporal Adaptive Residual Encoder(STARE)を提案します。 これは、時間的依存関係をグローバルに首尾一貫して捉えるために、適応的なチャネル再調整を備えた3D畳み込みのバックボーンを用います。 抽出段階では、Deep Integrity Restoration Decoder(DIRD)を設計します。 これは、潜在特徴を復元するために3Dアテンションを備えた時空間ホアグラス(砂時計)アーキテクチャを利用し、重度の顔操作の下でもウォーターマーク信号を正確に抽出できるようにします。 さらに、本研究では、この領域の研究を促進するために、GIFの先行型フォレンジック向けとして初の大規模ベンチマークデータセットGIFfacesを構築します。 広範な実験結果により、GIFGuardが高い忠実度の視覚品質を達成し、ディープフェイクに対して顕著な頑健性性能を示すことがわかりました。 関連するコードとデータセットは公開されます。
GIFGuard:顔面GIFに対する深偽造への事前検知型フォレンジックを実現する時空間ウォーターマーキング
arXiv cs.CV / 2026/4/30
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、アニメーションGIFの顔画像に対する深偽造(ディープフェイク)への事前検知型フォレンジックを目的にした、時空間ウォーターマーキングの新枠組み「GIFGuard」を提案しています。
- 埋め込み段階では、STAREとして、3D畳み込みバックボーンと適応的なチャネル再調整を用いて、上位レベルの意味改変に対しても頑健性を高めます。
- 取り出し段階では、DIRDとして、3Dアテンション付きの時空間アワーグラス構造で潜在特徴を復元し、強い顔操作下でもウォーターマーク信号を正確に抽出できるようにします。
- さらに、GIF事前フォレンジックのための初の大規模ベンチマークとなるデータセット「GIFfaces」を構築し、画質の高忠実さと深偽造耐性の高さを示しています。
- 関連コードとデータセットは公開予定であると述べています。



