M3D-Net：ディープフェイク検出のためのマルチモーダル3D顔特徴再構成ネットワーク

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、単一視点のRGB画像から微細な3D顔の形状と反射（反射率）を再構成しつつ、ディープフェイク検出を行うデュアルストリーム型のM3D-Netを提案しています。
自己教師ありの3D顔再構成モジュールにより、明示的な3Dラベルに依存せずに3D表現を学習します。
3D Feature Pre-fusion Module（PFM）によるマルチスケール特徴の適応的調整と、注意機構でRGBと3D再構成特徴を統合するMulti-modal Fusion Module（MFM）により、精度と頑健性を高めます。
複数の公開データセットで、既存手法を上回る検出精度とロバスト性、さらに多様なシナリオへの強い汎化が報告されています。
要点は、顔の個別属性のみを用いるのではなく、補完的なマルチモーダル特徴を活用する点にあります。