セマンティックなきめ細かな整合とMixture-of-Expertsによる顔画像偽造検出のドメイン横断評価の再考
arXiv cs.CV / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、顔画像偽造検出器の性能がデータセット間で十分に伸びない主因として、(特にクロスデータセットAUCのような)評価指標がドメイン横断でのスコア比較可能性の問題を捉えられていない点を指摘している。
- それを明示的に評価するために、Cross-AUCという指標を提案しており、あるデータセットの実画像と別データセットの偽画像(およびその逆)を対比してデータセット対ごとのAUCを計算する。
- Cross-AUCで代表的な検出器を評価すると大きな性能低下が観測され、見落とされてきた頑健性(ロバスト性)の問題が明らかになることを示している。
- さらにSFAM(Semantic Fine-grained Alignment and Mixture-of-Experts)という枠組みを提案し、パッチ単位の画像・テキスト整合モジュールでCLIPが改変アーティファクトへ敏感になるようにし、顔領域のMixture-of-Expertsで領域に応じた偽造解析を行う。
- 公開データセットでの定性的・定量的実験により、提案手法が複数の指標において最先端手法より優れた性能を達成すると報告している。



