AURA:現実世界の都市ナビゲーションのためのマルチモーダル共有オートノミー
arXiv cs.RO / 2026/4/3
💬 オピニオンSignals & Early TrendsModels & Research
要点
- 本論文は、長期ホライズンの都市ナビゲーションのための新しいマルチモーダル共有オートノミー・フレームワークであるAURAを提案し、タスクを高レベルの人間の指示と低レベルのAI制御に分割する。
- AURAは、視覚と空間文脈の整合性を、多様な視覚言語(vision-language)による人間の指示とより適切に合わせるための「Spatial-Aware Instruction Encoder」を用いる。
- テレオペレーションデータと視覚言語の説明を組み合わせた大規模学習データセットであるMM-CoSを提案し、現実的な指示シナリオでの学習を可能にする。
- シミュレーションと実環境の両方での実験により、ナビゲーションの安定性と指示追従性が向上し、さらにオンライン適応能力も示される。
- 同等のテイクオーバー条件のもとで、共有オートノミー手法は人間のテイクオーバー頻度を44%以上低減し、オペレータの負担や疲労を測定可能な形で軽減できることを示唆する。




