要旨: 映像ゲームのストリーミングの発展は急速に進んでおり、YouTubeやTwitchのような主要プラットフォームでは異なるコーデックが使用されています。どのコーデックでも一貫して動作する品質評価モデルを支援するには、大規模で多様な主観的ゲーム品質データセットにアクセスできることが必要です。現状では利用可能なデータセットはわずかで、それぞれに制約があります。このギャップを埋めるために、本研究では、これまでで最大規模のゲーム動画品質データセットを提示します。ユーザー生成コンテンツ(UGC)とプロフェッショナル生成コンテンツ(PGC)の両方を、広範な視覚的多様性とともに取り込みます。本データセットは最も広く用いられているコーデック――H.264、H.265、AV1――を対象としており、全4,048本の動画サンプルから構成されます。各サンプルには、平均37件の平均意見スコア(MOS)評価が付与されています。全体の品質スコアに加えて、粗視度(coarse-grained)の品質属性も収集しており、知覚に関わる要因をよりよく理解できるようにしています。本データセット上で、主要な映像品質評価手法の性能を調査します。そこには、すべてのベンチマークを上回るビジョン・ランゲージ・モデルが含まれます。私たちの知る限り、本データセットは、複数のコーデックとコンテンツ種別にまたがるゲーム動画品質評価を、品質属性まで含めて包括的に扱った最初のデータセットです。本データセットは https://rajeshsureddi.github.io/GameScope/ で公開されています。
GameScope:マルチ属性・マルチコーデックに対応したゲーム映像の画質評価用ベンチマークデータセット
arXiv cs.CV / 2026/5/5
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- GameScopeは、YouTubeやTwitchなどで使われる複数の配信コーデックにわたって一貫した評価を可能にする、ゲーム映像の画質評価向けの新しいベンチマークデータセットです。
- ユーザー生成コンテンツ(UGC)とプロ生成コンテンツ(PGC)を組み合わせ、実環境のゲーム映像を反映できるよう幅広い視覚的多様性を提供します。
- データセットには、最も一般的なコーデックであるH.264、H.265、AV1をカバーする4,048本の映像サンプルが含まれ、各サンプルは平均37件のMOS(平均オピニオンスコア)評価でアノテーションされています。
- 総合的な画質スコアに加えて粗い粒度の品質属性も収集しており、知覚上のどの要因が画質の印象に影響するのかをモデルが理解しやすくします。
- 主要な動画画質評価手法をデータセットでベンチマークし、ビジョン言語モデルが全ベンチマークを上回る性能を示したと報告しており、データセットは公開されています。




