周波数対応型セマンティック融合とゲート付き注入によるAI生成画像検出
arXiv cs.CV / 2026/5/1
📰 ニュースModels & Research
要点
- 本論文は、未知の生成器に直面した際に検出性能が大きく落ち、一般化が難しくなるAI生成画像検出の課題に取り組んでいる。
- 一般化不良の主因として、(1) 周波数が“生成器ごとに見分けやすい手がかり”へ偏る「周波数ショートカット・バイアス」と、(2) 高レベル意味表現と低レベル周波数パターンの間で表現が衝突することを挙げている。
- 提案手法 Frequency-aware Gated Injection Network(FGINet)は、Band-Masked Frequency Encoder(BMFE)により周波数領域で帯域マスクを行い、生成器固有のアーティファクトへの依存を下げてより汎用的な表現を促す。
- さらに Layer-wise Gated Frequency Injection(LGFI)で、適応的なゲートを用いて周波数手がかりを段階的にビジョン・ファウンデーションモデルへ注入し、階層的な抽象度における表現衝突を緩和する。
- Hyperspherical Compactness Learning(HCL)によりコンパクトでよく分離された埋め込みを学習し、複数データセットで強い一般化と最先端性能が示されている。
関連記事

AIエージェントがソフトウェア開発を行う仮想の会社「CHATDEV」を設立!?
AI-SCHOLAR

BizNodeでのあらゆるハンドル呼び出しにWFIDが付与される—説明責任のためのユニバーサルな取引参照
Dev.to

TestSprite MCPサーバー完全ガイド(インドネシア語)— Getting Startedドキュメント
Dev.to

MCP、スキル、AIエージェント、そして新しいモデル:ソフトウェア開発の新スタック
Dev.to

GitHub - intel/auto-round:高精度な低ビットLLM推論のためのSOTA量子化アルゴリズム(CPU/XPU/CUDA最適化、複数データ型対応、vLLM・SGLang・Transformers互換)
Reddit r/LocalLLaMA