VRAG-DFD:MLLMベースのディープフェイク検出のための検証可能なリトリーバル拡張
arXiv cs.CV / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、プロの改ざん(フォージェリー)知識が乏しい状況でも性能を向上させることを目的とした、MLLMベースのディープフェイク検出のための検証可能なリトリーバル拡張フレームワーク「VRAG-DFD」を提案する。
- Retrieval-Augmented Generation(RAG)と強化学習を組み合わせることで、改ざん知識を動的に取得し、不正確な参照情報下でもより重要な推論を支援する。
- 著者らは、2つのRAGに焦点を当てたデータセットを構築する。FKDはフォージェリー知識のアノテーション、F-CoTはチェイン・オブ・ソート(思考連鎖)を構築するためのデータセットであり、モデルが鑑識知識と推論の痕跡を学習できるようにする。
- 学習は、3段階のパイプライン(Alignment → SFT → GRPO)を用いて、モデルの批判的推論能力を段階的に育成するよう設計されている。
- 実験では、ディープフェイク検出の汎化テストにおいて先行技術(SOTA)および競争力のある結果が報告されており、静的な知識注入アプローチを超えた頑健性の向上が示唆される。




