M3D-Net:ディープフェイク検出のためのマルチモーダル3D顔特徴再構成ネットワーク

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、単一視点のRGB画像から微細な3D顔の形状と反射(反射率)を再構成しつつ、ディープフェイク検出を行うデュアルストリーム型のM3D-Netを提案しています。
  • 自己教師ありの3D顔再構成モジュールにより、明示的な3Dラベルに依存せずに3D表現を学習します。
  • 3D Feature Pre-fusion Module(PFM)によるマルチスケール特徴の適応的調整と、注意機構でRGBと3D再構成特徴を統合するMulti-modal Fusion Module(MFM)により、精度と頑健性を高めます。
  • 複数の公開データセットで、既存手法を上回る検出精度とロバスト性、さらに多様なシナリオへの強い汎化が報告されています。
  • 要点は、顔の個別属性のみを用いるのではなく、補完的なマルチモーダル特徴を活用する点にあります。