動画サリエンシ予測に関するNTIRE 2026チャレンジ:手法と結果

arXiv cs.CV / 2026/4/17

📰 ニュースSignals & Early TrendsModels & Research

要点

  • NTIRE 2026チャレンジ(動画サリエンシ予測)は、提示された動画系列に対して自動的にサリエンシマップを予測する手法の開発を目的として行われました。
  • 主催者は、5,000人超の評価者からクラウドソーシングのマウストラッキングにより収集した注視情報をもとにした教師データを含む、2,000本の多様なオープンライセンス動画データセットを新たに公開しました。
  • 評価は、一般的に受け入れられた品質指標を用いて、800本のテスト動画の一部で実施されました。
  • チャレンジには20チーム以上が参加し、コードレビューを通過して最終段階に進んだのは7チームでした。
  • チャレンジで使用されたデータはすべて公開されており、追加研究やベンチマークに活用できます:https://github.com/msu-video-group/NTIRE26_Saliency_Prediction。

Abstract

本論文は、動画注視予測に関するNTIRE 2026チャレンジの概要を提示する。チャレンジ参加者の目的は、提供された動画系列に対して自動の注視(サリエンシー)マップ予測手法を開発することであった。本チャレンジのために、オープンライセンスの多様な2,000本の動画からなる新しいデータセットが用意された。注視点(fixations)および対応するサリエンシーマップは、クラウドソーシングによるマウストラッキングを用いて収集され、5,000人超の評価者による視聴データを含んでいる。評価は、一般に受け入れられている品質指標を用いて、800本のテスト動画のサブセットで実施された。チャレンジは20以上のチームを集めて投稿が行われ、コードレビューを経て最終フェーズを通過したのは7チームであった。本チャレンジで使用したすべてのデータは公開されており、https://github.com/msu-video-group/NTIRE26_Saliency_Prediction で参照できる。