Omni-Fake：統合マルチモーダルSNSディープフェイク検出のベンチマーク

arXiv cs.CV / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

この論文は、ソーシャルメディア環境におけるディープフェイク検出の性能を評価するための統合マルチモーダル・ベンチマーク「Omni-Fake」を提案しています。
Omni-Fakeは2つのデータセットで構成され、Omni-Fake-Set（1M+の高品質サンプル）と、学習から意図的に除外したOmni-Fake-OOD（200k+のアウト・オブ・ディストリビューション・サンプル）により汎化性能を検証します。
このベンチマークは画像・音声・動画・音声付きトーキングヘッドの4モダリティを扱い、検出に加えて位置特定と説明を行う統合プロトコルに対応しています。
著者らは、視覚と聴覚の手がかりを状況に応じて統合し、位置特定と自然言語による説明を含む構造化出力を行う強化学習ベースの検出器「Omni-Fake-R1」も提案しています。
実験では、既存の最先端ベースラインに比べて検出精度、クロスモーダル汎化、説明可能性が大きく向上したと報告されています。