混雑環境を切り抜ける:複数ロボットシステムのためのウェイポイントに基づくバイレベル計画

arXiv cs.RO / 2026/4/24

📰 ニュースModels & Research

要点

  • 本論文は、ロボット同士の衝突、ロボットと障害物の衝突、到達不能な動作といった物理的制約を考慮しつつ、混雑環境における複数ロボットの計画問題に取り組む。
  • 高レベルのタスク計画と低レベルの運動計画を独立に扱うのではなく、両者を共同で最適化するハイブリッドなバイレベル制御フレームワークを提案する。
  • 低レベルの運動計画を扱いやすくするため、ウェイポイントに基づく軌道表現を導入し、単純さと表現力を両立する。
  • 2つの計画レベル間のクレジット割当問題に対して、カリキュラムベースの学習戦略と修正版RLVRを用い、運動計画器からタスク計画器へ運動の実行可能性フィードバックを伝播させる。
  • 密な障害物と最大9台のロボットを含むBoxNet3D-OBSでの実験では、モーションに無関係な手法やVLAベースのベースラインに比べてタスク成功率が一貫して向上し、コードもGitHubで公開されている。

要旨: 障害物が密集した環境におけるマルチロボット制御は、ロボット間の衝突、ロボットと障害物の衝突、到達不能な動作といった複雑な物理的制約を伴うため、難しい問題です。このような状況で成功する計画には、高レベルのタスク計画と低レベルの運動計画の双方にわたる同時最適化が必要です。というのも、物理的制約の違反は、どちらかのレベルでの失敗に起因して発生し得るからです。しかし、タスク計画と運動計画を共同で最適化することは、低レベルの運動軌道の複雑なパラメータ化と、2つの計画レベル間でのクレジット割当ての曖昧さにより困難です。本論文では、タスク計画と運動計画を共同で最適化するハイブリッドなマルチロボット制御フレームワークを提案します。低レベル計画の効果的なパラメータ化を可能にするために、運動軌道を表す単純でありながら表現力のある表現としてウェイポイントを導入します。クレジット割当ての課題に対処するために、運動計画からタスク計画へ運動の実現可能性に関するフィードバックを伝播させる、修正版のRLVRアルゴリズムを用いたカリキュラムベースの学習戦略を採用します。密な障害物と最大9台のロボットを含む、挑戦的なマルチロボットベンチマークであるBoxNet3D-OBSに対する実験の結果、提案手法は運動を考慮しないベースラインおよびVLAベースラインに比べて、タスク成功を一貫して改善することを示しました。コードは https://github.com/UCSB-NLP-Chang/navigate-cluster で公開しています