DCMorph:双方向ストリームのクロスアテンションによる拡散を用いたフェイスモーフィング

arXiv cs.CV / 2026/4/24

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この論文では、DCMorphというデュアルストリームの拡散ベース・モーフィング手法を提案し、アイデンティティ検証システムを狙ってアイデンティティ情報と潜在空間表現の両方で条件付けを行います。
  • 画像レベル手法やGANベース手法が抱えるブレンドアーティファクトや再構成精度の限界に対し、分離したクロスアテンション補間でノイズ除去過程にアイデンティティ固有の特徴を注入し、DDIM反転と球面補間で幾何学的に一貫した潜在初期化を行うことで改善を図っています。
  • 2つのソース顔からの明示的なデュアル・アイデンティティ条件付けを可能にし、既存の拡散ベースのモーフィング手法の制約を回避することを狙っています。
  • 4つの最先端フェイス認識システムに対する脆弱性分析の結果、DCMorphはテストした両方の運用閾値において、既存手法よりも最高の攻撃成功率を達成しました。
  • さらに、現在のモーフィング攻撃検出ソリューションでは検出が難しいことも報告されており、防御面でのギャップが示唆されています。

Abstract

顔モーフィング攻撃手法の進展に対応することは、進化する脅威を見据え、本人確認システムのための堅牢な防御メカニズムを開発するうえで重要である。本研究では、アイデンティティ条件と潜在空間の両レベルで同時に動作するデュアルストリームの拡散ベース・モーフィング枠組みであるDCMorphを提案する。画像レベルの手法で問題となるブレンディングのアーティファクトや、再構成忠実度が限定的なGANベースのアプローチとは異なり、DCMorphはアイデンティティ条件付き潜在拡散モデルを、2つのメカニズムによって活用する:(1) 脱結合したクロスアテンション補間により、両方のソース顔からアイデンティティ固有の特徴を注入し、ノイズ除去プロセスに反映させることで、既存の拡散ベース手法にはない明示的なデュアル・アイデンティティ条件を可能にする。および(2) 両方のソース顔から得た反転潜在表現間で球面補間を行うDDIM反転により、構造的属性を保持しつつ、幾何学的に一貫した初期潜在表現を提供する。最先端の顔認識システム4つを対象とした脆弱性分析の結果、DCMorphは、運用上の閾値の両方において、既存手法と比較して最も高い攻撃成功率を達成しながらも、現在のモーフィング攻撃検出ソリューションでは検出が困難であることが示される。