NTIRE 2026 第3回 Restore Any Image Model（RAIM）チャレンジ：プロフェッショナル画像品質評価（トラック1）

arXiv cs.CV / 2026/4/15

📰 ニュースSignals & Early TrendsModels & Research

共有:

要点

NTIRE 2026 では第3回 Restore Any Image Model（RAIM）チャレンジが開催され、トラック1として in-the-wild におけるプロフェッショナル画像品質評価（PIQA）に焦点が当てられました。
本論文では、スカラー値による従来のIQA手法が、微妙な差異を捉えるのに苦労し、実行可能な視覚ガイダンスに必要な「なぜ」を提供できないと主張しています。
これに対処するため、チャレンジでは、画像ペアに対する人間の専門家のような評価を行えるマルチモーダル大規模言語モデル（MLLM）をベンチマーク化し、比較による選択と、根拠に基づく解釈的な推論の両方を求めました。
参加者は (1) 高品質なペアの中からより良い画像を選ぶこと、(2) 専門家レベルの説明を生成すること、の2点で評価されました。約200件の登録と2,500件以上の提出がありました。
データセットおよびチャレンジ関連リソースは公開されており、報告によればプロフェッショナルIQAにおける最先端の進展につながったとされています。
本チャレンジは CodaBench を通じて調整され、データセットは GitHub でホストされているため、今後の研究での再利用が可能です。
categories には、発表が研究／ベンチマークの性質であることを反映する models-research が含まれています。

要旨: 本論文では、3回目となる「野外のあらゆる画像を復元（Restore Any Image Model in the Wild）」に関するNTIRE 2026チャレンジの概要を、特にトラック1: プロフェッショナル画像品質評価に焦点を当てて紹介します。従来の画像品質評価（IQA）は通常、スカラー指標に依存します。複雑な視覚的特性を単一の数値へ圧縮することにより、これらの手法は、見た目の品質が一様に高い画像同士の微妙な違いを本質的に区別することが難しくなります。さらに、それらは「なぜその画像が優れているのか」を説明できません。つまり、視覚タスクのための指針を与えるのに必要な推論能力が欠けています。このギャップを埋めるために、近年のマルチモーダル大規模言語モデル（MLLMs）の進展は有望なパラダイムを提供しています。この可能性に触発され、我々のチャレンジでは、高品質な画像ペアを評価する際に、MLLMが人間の専門家の認知を模倣できる能力を探る新しいベンチマークを確立しました。参加者は、プロフェッショナルな状況における重要なボトルネックの克服を求められ、主に次の2つの目的に焦点を当てました:（1）比較による品質選択: 高品質なペアの中から、視覚的に優れた画像を確実に特定すること、（2）解釈的推論: 選択の根拠を詳細に示す、根拠に基づいた専門家レベルの説明を生成すること。総計で、このチャレンジには約200件の登録と、2,500件を超える投稿が集まりました。最高性能の手法は、プロフェッショナルIQAにおける最先端を大きく前進させました。チャレンジ用データセットは https://github.com/narthchin/RAIM-PIQA で利用可能であり、公式ホームページは https://www.codabench.org/competitions/12789/ からアクセスできます。