DeCoNav：対話強化ロングホライズン協調ビジョン言語ナビゲーション

arXiv cs.RO / 2026/4/15

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

DeCoNavは、複数ロボットシステムにおけるロングホライズン協調ビジョン言語ナビゲーションのための、分散型かつ対話強化フレームワークを導入し、同期された共有世界での実行や適応的な協調が欠けていた従来ベンチマークの限界に対処します。
本手法は、イベント駆動型の対話を通じてコンパクトな意味状態を交換し、新たな証拠、不確実性、またはエージェント間の競合が生じたときに、ロボットが動的に部分目標を再割り当てし、再計画できるようにします。
中央コントローラを用いずに、対話によりトリガーされる再計画に結び付けられた同期実行セマンティクスに依拠することで、リアルタイムの適応的協調を可能にします。
DeCoNavBenchは本アプローチを実装しており、176のHM3Dシーンにわたる1,213タスクを用いて評価し、双方成功率（BSR）を69.2%改善したと報告しています。これは、対話に基づく計画の動的再割り当てによる強い効果を示しています。

Abstract

長期の協調ビジョン言語ナビゲーション（VLN）は、単一のエージェントでは成し得ない複雑なタスクを達成するために、多ロボットシステムにとって重要です。CoNavBenchは、リレー形式のマルチロボットタスク、コラボレーションの分類法、さらにハンドオフやランデブーを共通環境でモデリングするためのグラフに基づく生成と評価を伴って、最初の協調型の長期ホライズンVLNベンチマークを導入することで、その第一歩を踏み出します。しかし、既存のベンチマークや評価は多くの場合、共有された世界のタイムラインに対して厳密に同期された二者ロボットのロールアウト（実行）を強制しておらず、また新たなエージェント間の根拠（エビデンス）が出現した際に適応できない静的な協調ポリシーに依存しがちです。そこで本論文では、イベント駆動型の対話と動的なタスク割り当て、ならびに再計画を組み合わせる分散型フレームワークである、対話強化長期協調ビジョン言語ナビゲーション（DeCoNav）を提案します。DeCoNavでは、中央制御器なしで、ロボット同士が対話を通じてコンパクトな意味状態を交換します。新たなエビデンス、未知性（不確実性）、または競合などの情報性の高いイベントが生じた場合には、対話をトリガーとして同期実行のもとで部分目標の再割り当てを動的に行い、再計画します。DeCoNavBenchにおいて、176のHM3Dシーンに対し1,213タスクを実装した結果、DeCoNavは双方成功率（BSR）を69.2%向上させ、多ロボット協調における対話主導の動的に再配分された計画の有効性を示します。