AgentFoX: 説明可能性を備えたLLMエージェント誘導型融合によるAI生成画像検出

arXiv cs.CV / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • AgentFoXは、AI生成画像検出を単一モデルの判定ではなく、LLMエージェントが複数フェーズで分析する動的プロセスとして再定義するフレームワークです。
  • 事前に用意した知識ベース(calibrated Expert Profiles と contextual Clustering Profiles)に基づき、意味的評価から信号レベルの専門家エビデンス統合へ段階的に進み、矛盾は構造化推論で解消します。
  • 既存手法が周波数領域パターンや意味的不整合など特定の人工物に最適化されがちな点を、検出根拠を統合して改善しようとしています。
  • 検出結果を単なる2値(合成/本物)ではなく、人が読める詳細なフォレンジックレポートとして提示し、解釈可能性と信頼性の向上を狙います。
  • 将来の新しいフォレンジック手法を追加しながら拡張できるスケーラブルなエージェント的統合パラダイムも提案しています。