ME-IQA:リランキングによるメモリ強化画像品質評価
arXiv cs.CV / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、推論機能を備えた視覚言語モデル(VLM)を用いた画像品質評価のための、プラグアンドプレイかつテスト時メモリ強化リランキング枠組みであるME-IQAを提案する。
- 推論サマリに基づいて意味的かつ知覚的に整合した近傍を検索することでメモリバンクを構築し、推論時のより有益な比較を可能にする。
- ME-IQAではVLMを確率的コンパレータとして扱い、ペアごとの選好確率を生成し、ThurstoneのCase Vモデルを用いて順序(ordinal)の証拠を元のスカラー評価値と融合する。
- 将来の判断を改善し、離散的なスコアの崩壊を抑えるために、ゲート付きのリフレクション手順とメモリ統合を用い、より密で歪みに敏感な予測を実現する。
- 複数のIQAベンチマークでの実験により、強力な推論誘導VLMベースライン、非推論型IQA手法、および他のテスト時スケーリング手法に対して一貫した改善が報告されている。