VEFX-Bench:汎用的な動画編集とVFXのためのホリスティックなベンチマーク
arXiv cs.CL / 2026/4/20
📰 ニュースModels & Research
要点
- 本論文は、9つの編集カテゴリ/32のサブカテゴリにまたがる5,049本の例を含む、人手によるラベル付けの大規模データセット「VEFX-Dataset」を提示し、編集品質を3つの独立した次元で評価できるようにします。
- 「VEFX-Reward」は、元動画・編集指示・編集後動画を同時に扱い、動画編集品質をスコア化するための専用報酬モデルとして提案されます。
- 「VEFX-Bench」は、編集システム同士を標準化して比較するための、300の厳選された動画プロンプト対からなるベンチマークとして公開されます。
- 実験の結果、VEFX-Rewardは汎用のVLM判定や既存の報酬モデルよりも、人間の判断とより強く一致することが示されます。
- VEFX-Rewardを用いたベンチマークでは、現行モデルにおいて「見た目のもっともらしさ」「指示追従」「編集の局所性(edit locality/edit exclusivity)」の間に継続的なギャップがあることが明らかになります。



