パターンとコンテンツのバイアスへの対抗:一般化されたAI生成画像検出のための敵対的特徴学習

arXiv cs.CV / 2026/4/15

📰 ニュース

要点

  • 本論文は、現在のAI生成画像検出器はしばしば学習データに存在する生成パターンや特定のコンテンツ・バイアスに過適合してしまい、その結果、モデルをまたいだ汎化が制限されると主張している。

要旨: 近年、生成的人工知能技術の急速な発展により、高品質な偽画像を作成するためのハードルが大幅に下がり、情報の真正性と信頼性に対する深刻な課題となっています。既存の生成画像検出手法は、一般にモデルのアーキテクチャやネットワーク設計によって汎化性能を高めています。しかし、汎化性能はデータバイアスの影響を受けやすく、学習データがモデルに対して、異なる生成モデルから生成された画像に共通する特徴ではなく、特定の生成パターンやコンテンツに適合するよう駆動してしまう可能性があります(非対称バイアス学習)。この問題に対処するため、我々は多次元敵対的特徴学習(MAFL)フレームワークを提案します。このフレームワークは、事前学習済みのマルチモーダル画像エンコーダを特徴抽出のバックボーンとして採用し、真偽(リアル/フェイク)の特徴学習ネットワークを構築し、さらに多次元の敵対的損失を備えた敵対的バイアス学習ブランチを設計することで、真正性を識別する特徴学習とバイアス特徴学習の間に敵対的学習メカニズムを形成します。生成パターンやコンテンツのバイアスを抑制することで、MAFLはモデルが異なる生成モデル間で共有される生成的特徴に注目するよう導き、その結果、実画像と生成画像の根本的な違いを効果的に捉え、クロスモデル汎化性能を向上させ、大規模な学習データへの依存を大幅に低減します。広範な実験による検証の結果、本手法は既存の最先端手法に比べ、精度で10.89%、平均適合率(AP)で8.57%上回ります。特に、320枚の画像のみで学習した場合でも、公的データセットにおいて検出精度が80%超を達成できます。