要旨: 近年の画像編集の進歩により、信頼性の高い画像編集品質評価(IEQA)の必要性が高まっている。従来の手法とは異なり、IEQAでは、マルチモーダル入力に対する複雑な推論と、多次元にわたる評価が求められる。既存のMLLMベースのアプローチの多くは、人間のヒューリスティックなプロンプトに依存しており、これにより2つの主要な限界が生じる。すなわち、(1)硬直したメトリックのプロンプト設計、(2)距離に非依存なスコアのモデリングである。これらの問題は、暗黙の人間の基準との整合性を妨げるだけでなく、スコア空間の連続的な構造を捉え損ねる。そこで本研究では、評価基準とスコア表現を共同で学習する統一フレームワークであるDefine-and-Score画像編集品質評価(DS-IEQA)を提案する。具体的には、確率的なフィードバックによりメトリック定義を自動的に改善するFeedback-Driven Metric Prompt Optimization(FDMPO)を導入する。さらに、数値トークンを言語モデリングから切り離して、期待距離の最小化によってスコアの連続性を明示的にモデル化するToken-Decoupled Distance Regression Loss(TDRL)を提案する。大規模な実験の結果、本手法は優れた性能を示し、追加の学習データなしで2026年のNTIRE X-AIGC 品質評価トラック2において第4位となった。
画像編集アセスメントのための品質基準の再定義と距離に応じたスコアモデリング
arXiv cs.CV / 2026/4/15
📰 ニュース
要点
- 本論文は、画像編集品質アセスメント(IEQA)には、既存のMLLMアプローチで用いられているような硬直したメトリクス・プロンプトや距離非依存のスコアリングを超えて、人間の判断により整合する信頼性の高い基準と、連続的なスコアモデリングが必要だと主張する。