広告

反復的なリスク配分によるリスク上限制約型マルチエージェント視覚ナビゲーション

arXiv cs.RO / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 複雑な視覚環境における実験により、ベースラインに比べて成功率が向上することが示され、本手法が、可能な場合には移動時間を短縮するために利用可能な安全予算をより適切に活用できることが実証されている。

要旨: 安全なナビゲーションは、特に複数のエージェントが高次元の視覚観測のみを用いて協調しなければならない場合に、危険な環境で自律システムが動作するために不可欠です。近年の手法では、グラフ構築に対する目標条件付き強化学習(GCRL)と、計画に対する競合ベース探索(CBS)をうまく組み合わせることで成功を収めていますが、典型的には安全を強制するためにCBSを実行する前に高リスクなエッジを削除するという方策に依存しています。この二値的な戦略は過度に保守的で、たとえ集約されたリスクが許容範囲であっても、高リスク領域を通過する必要がある現実的なミッションを排除してしまいます。
この課題に対処するために、我々はリスク制約付きマルチエージェント経路探索(\Delta-MAPF)の枠組みを提案します。この枠組みでは、エージェントがユーザ指定のグローバルなリスク予算(\Delta)を共有します。エッジを恒久的に破棄するのではなく、標準的なCBSプランナと統合される反復的リスク配分(IRA)レイヤを通じて、探索中にエージェントごとのリスク予算(\delta_i)を動的に分配します。分配戦略として、迅速な実行可能性の修復のための貪欲な余剰-不足スキームと、リスクを価格付けされた資源として扱う市場に着想を得た仕組みの2つを検討します。市場ベースの機構は、調整可能なトレードオフをもたらし、エージェントは利用可能なリスクを活用してより短く効率的な経路を確保できますが、予算がより厳しい場合には長く安全な迂回路へと切り替えます。複雑な視覚環境での実験により、我々の動的配分枠組みはベースラインよりも高い成功率を達成し、利用可能な安全予算を効果的に活用して移動時間を削減できることが示されます。プロジェクトのWebサイトは https://rb-visual-mapf-mers.csail.mit.edu にあります

広告