拡散ノイズを用いたディープフェイク検出の汎化性能向上

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、新しい生成手法が登場する中でディープフェイク検出器が汎化に失敗する課題、特に拡散モデルによるディープフェイクへの対応を扱っています。
Attention-guided Noise Learning（ANL）という枠組みを提案し、事前学習済みの拡散モデルを検出パイプラインに組み込んで、拡散ステップのノイズ予測を通じて頑健な特徴を学習します。
検出器は、拡散の復元（denoising）過程を利用して実画像と合成画像の微細な差異を捉えるよう訓練され、さらに予測ノイズに基づく注意誘導メカニズムにより局所的な痕跡ではなくグローバルに分布した差異へ注目させます。
複数のベンチマークで、ANLが既存手法を大きく上回り、拡散生成ディープフェイクの検出で最先端（SOTA）精度を達成したことを示しています。
また、推論時の追加オーバーヘッドを増やさずに、未知の改ざんタイプ（未見モデル）での汎化性能（例：ACC/APの大幅改善）も向上すると報告しています。

Abstract

ディープフェイク検出器は、新しい画像合成技術が登場するにつれて、一般化における課題がますます深刻になっています。とりわけ、拡散モデルによって生成されるディープフェイクは非常にフォトリアルであり、GANベースの偽造に対して訓練された検出器をしばしば回避します。本論文は、拡散ノイズの特性を活用することで、ディープフェイク検出における一般化問題に取り組みます。具体的には、事前学習済みの拡散モデルをディープフェイク検出パイプラインに統合し、より頑健な特徴の学習を導く、Attention-guided Noise Learning（ANL）フレームワークを提案します。具体的に、提案手法では拡散モデルの除ノイズ過程を用いて微細なアーティファクトを顕在化させます。検出器は、ある拡散ステップにおいて入力画像に含まれるノイズを予測するよう訓練され、実画像と合成画像の間の相違点を捉えることを強制します。さらに、予測されたノイズから導出される注意（アテンション）ガイド付きのメカニズムを導入し、局所的なパターンではなく、広域に分布した相違点にモデルが注目することを促します。凍結した拡散モデルが学習した自然画像の分布を活用することで、ANL手法は一種の正則化として機能し、未見の偽造タイプに対する検出器の一般化性能を向上させます。大規模な実験により、ANLは複数のベンチマークで既存手法を大きく上回り、拡散生成によるディープフェイク検出において最先端の精度を達成することが示されます。特に、提案フレームワークは、（未見のモデルに対するACC/APの大幅な改善など）一般化性能を高める一方で、推論時の追加オーバーヘッドは導入しません。本結果は、拡散ノイズが、一般化可能なディープフェイク検出のための強力な信号になり得ることを示しています。