ACPO:アンカー制約付き知覚最適化による、ノーリファレンス品質ガイダンスを用いた拡散モデル
arXiv cs.AI / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ピクセル単位のフルリファレンス目的で学習されがちな拡散モデルが、主観的な視覚品質やテキストと画像の意味整合性で不十分になり得る点に取り組む。
- 著者らは、学習済みNR-IQAモデル(ノーリファレンス画像品質評価)を知覚ガイダンスとして用いて、ノーリファレンスの知覚品質を拡散学習へ組み込むことを提案する。
- ただし、知覚信号をそのまま最適化すると学習不安定化や分布ドリフトが起きるため、安定化の課題があると指摘する。
- そこで、アンカー制約付き最適化フレームワークを導入し、ノイズ予測の観点で基盤拡散モデルとの整合性を正則化して微調整を安定にする。
- 実験では、知覚品質の向上を達成しつつ生成多様性と学習安定性を維持できることが示され、元の生成挙動を損なわずに知覚的に好ましい出力へ制御的に適応できる可能性が示される。




