HEDGE:野外におけるAI生成画像の検出のためのヘテロジニアス・アンサンブル

arXiv cs.CV / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • HEDGE(Heterogeneous Ensemble for Detection of AI-Generated images)は、単一の学習設定やモデルバックボーンではなく、構造化されたヘテロジニアス(異質性)を用いることで、現実世界の条件下でAI生成画像を検出することの難しさに対処します。
  • 本手法は、3つの軸にまたがって相補的な検出「ルート」を構築します。すなわち、段階的に拡張されたDINOv3ベースの検出器、きめ細かなフォレンジック(鑑識)手掛かりのための高解像度ブランチ、そしてバックボーンの多様性を導入するMetaCLIP2ベースのブランチです。
  • 異なるブランチの出力は、加重平均によってロジット空間で融合され、その後、軽量なデュアルゲーティング機構によって、ブランチ単位の外れ値や融合エラーを緩和し性能を改善します。
  • 本論文は複数のベンチマークにおいて強い頑健性を報告しており、NTIRE 2026の「Robust AI-Generated Image Detection in the Wild Challenge」で4位入賞を果たし、最先端の性能と並ぶことを述べています。

要旨: 実環境におけるAI生成画像の堅牢な検出は、生成モデルの急速な進化と、現実世界で多様な歪みが加わることにより、依然として困難です。本研究では、単一の学習レジメン、解像度、またはバックボーンに依存するだけではあらゆる条件に対応するのは不十分であり、これらの次元にまたがる構造化された異質性が、堅牢な検出に不可欠であると主張します。そこで本研究では、HEDGE(Heterogeneous Ensemble for Detection of AI-GEnerated images)を提案します。HEDGEは、3つの軸に沿って相補的な検出ルートを導入します:強い拡張(augmentation)を伴う多様な学習データ、マルチスケール特徴抽出、そしてバックボーンの異質性です。具体的には、Route~Aは段階的なデータ拡張と拡張強度の段階的な引き上げにより、DINOv3ベースの検出器を漸進的に構築し、Route~Bはきめ細かなフォレンジックな手がかりのために高解像度ブランチを組み込み、Route~Cはバックボーンの多様性のためにMetaCLIP2ベースのブランチを追加します。これらのすべての出力は、logit空間での重み付き平均により融合され、さらに、ブランチ単位の外れ値と多数派に支配された融合エラーを扱う軽量なデュアルゲーティング機構によって洗練されます。HEDGEは、NTIRE 2026 Robust AI-Generated Image Detection in the Wild Challengeで4位を獲得し、複数のAIGC画像検出ベンチマークにおいて強い頑健性を伴う最先端の性能を達成しています。

HEDGE:野外におけるAI生成画像の検出のためのヘテロジニアス・アンサンブル | AI Navigate