推論トレース付きLongTail運転シナリオ:KITScenes LongTailデータセット

arXiv cs.CV / 2026/3/26

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この論文は、実世界での汎化が難しい希少な長尾シナリオを対象とする、エンドツーエンド運転のための新しいベンチマークであるKITScenes LongTailデータセットを紹介する。

要旨: 自動運転などの実世界の領域において、まれなシナリオへの一般化は根本的な課題であり続けています。これに対処するため、私たちはロングテールな運転イベントに焦点を当てたエンドツーエンド運転用の新しいデータセットを導入します。マルチビューの動画データ、軌跡、ハイレベルな指示、詳細な推論トレースを提供し、文脈内学習および少数ショットでの一般化を可能にします。VLMs や VLAs のようなマルチモーダルモデル向けに得られるこのベンチマークは、安全性や快適性の指標を超え、指示追従と、モデル出力間の意味的一貫性を評価します。英語・スペイン語・中国語のマルチリンガルな推論トレースは、文化的背景が多様なドメイン専門家によるものです。したがって、私たちのデータセットは、推論のさまざまな形式が運転能力にどのように影響するかを研究するための独自のリソースです。データセットは以下で利用可能です: https://hf.co/datasets/kit-mrt/kitscenes-longtail