要旨: 高度に現実的なAI生成画像(AIGI)の普及により、実用的な検出手法の開発が必要となってきました。現在のAIGI検出器はクリーンなデータセット上では十分に良好な性能を発揮しますが、「野外」で運用すると検出性能が低下することがよくあります。ここでいう「野外」とは、画像に予測不能で複雑な歪みが加えられる状況を指します。この重大な脆弱性に対処するために、我々は、深刻な歪み下でAIGIを頑健に検出することを目的として特別に設計された、新しいLoRAベースのペアワイズ学習(LPT)戦略を提案します。我々の戦略の中核は、視覚基盤モデルのターゲット付きファインチューニング、学習フェーズ中のデータ分布の意図的なシミュレーション、そして独自のペアワイズ学習プロセスにあります。具体的には、検証セットおよびテストセットから得られる分布により適合させるために、歪みとサイズのシミュレーションを導入します。視覚基盤モデルの強力な視覚表現能力に基づき、モデルをファインチューニングしてAIGI検出を実現します。一般化と頑健性の最適化を切り離すことで検出性能を向上させるために、ペアワイズ学習を利用します。実験の結果、我々のアプローチは「NTIRE 野外における頑健なAI生成画像検出」チャレンジで第3位を獲得しました
LoRAベースのペアワイズ学習による頑健なAIGI検出の強化
arXiv cs.CV / 2026/4/15
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、現実世界の歪みにより既存の検出器が失敗しがちな状況下で、AI生成画像(AIGI)検出の頑健性を向上させるためのLoRAベースのペアワイズ学習(LPT)手法を提案する。
- 具体的には、微調整によって視覚基盤モデルを対象とし、意図的な歪みとサイズのシミュレーションを用いることで、検証およびテスト条件で見られる画像分布により適合させることを目指す。
- 学習はペアワイズなプロセスとして構成されており、一般化と頑健性最適化を切り離すことを意図して、厳しい画像変換下での性能向上につなげる。
- 実験では有望な結果が示され、この手法は「NTIRE Robust AI-Generated Image Detection in the Wild」チャレンジで第3位となった。




