M3D-Net:ディープフェイク検出のためのマルチモーダル3D顔特徴再構成ネットワーク
arXiv cs.CV / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、単一視点のRGB画像から微細な3D顔の形状と反射(反射率)を再構成しつつ、ディープフェイク検出を行うデュアルストリーム型のM3D-Netを提案しています。
- 自己教師ありの3D顔再構成モジュールにより、明示的な3Dラベルに依存せずに3D表現を学習します。
- 3D Feature Pre-fusion Module(PFM)によるマルチスケール特徴の適応的調整と、注意機構でRGBと3D再構成特徴を統合するMulti-modal Fusion Module(MFM)により、精度と頑健性を高めます。
- 複数の公開データセットで、既存手法を上回る検出精度とロバスト性、さらに多様なシナリオへの強い汎化が報告されています。
- 要点は、顔の個別属性のみを用いるのではなく、補完的なマルチモーダル特徴を活用する点にあります。



