EagleVision:高速自律レーシングにおけるドメイン横断知覚のためのマルチタスクベンチマーク

arXiv cs.RO / 2026/4/14

📰 ニュースSignals & Early TrendsModels & Research

要点

  • EagleVisionのデータセットとベンチマークが公開されており、高速自律レーシングにおける知覚の汎化に関する体系的な研究を可能にする。

要旨: 高速自律レーシングは、大きな相対速度や、従来の都市走行データセットからの実質的なドメインシフトなど、極端な知覚(パーセプション)の課題を伴います。既存のベンチマークは、これらの高ダイナミックな条件を十分に捉えていません。そこで本研究では、EagleVision を提案します。これは、高速レースにおける 3D 検出と軌道予測のための統一的な LiDAR ベースのマルチタスク・ベンチマークです。Indy Autonomous Challenge データセット(14,893 フレーム)および A2RL Real コンペティション・データセット(1,163 フレーム)に対して新たに注釈付きの 3D バウンディングボックスを提供し、さらに 12,000 枚のシミュレータ生成の注釈付きフレームも併せて提供します。これらはすべて、共通の評価プロトコルのもとで標準化されています。データセット中心の転移(トランスファー)フレームワークを用いて、都市、シミュレータ、実走行レースの各ドメイン間におけるクロスドメイン汎化を定量化します。都市での事前学習は、スクラッチ学習による検出を改善します(NDS 0.72 vs. 0.69)。一方で、実走行レースデータによる中間事前学習は A2RL への最良の転移を達成します(NDS 0.726)。これは、シミュレータのみでの適応を上回ります。軌道予測については、Indy で学習したモデルが、A2RL のテストシーケンスにおいて A2RL 上でのインドメイン学習を上回ります(FDE 0.947 vs. 1.250)。これは、クロスドメイン予測において運動(モーション)分布のカバレッジが重要な役割を果たすことを示しています。EagleVision により、極端な高速ダイナミクス下での知覚汎化を体系的に研究できます。データセットとベンチマークは https://avlab.io/EagleVision で公開されています。