不確実性および通信制約下におけるダイナミックな多ロボット作業割当:ゲーム理論的アプローチ

arXiv cs.RO / 2026/4/15

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、作業がオンラインで到着するダイナミックな多ロボット作業割当を扱い、各作業が締切/時間ウィンドウを満たす必要があり、完了結果には不確実性がある状況を対象とする。
  • ハブ(拠点)を介したセンシング領域を導入し、不完全情報を取り込む。タスクの可視性はロボットの位置に依存する。また、通信グラフによって、ハブ間で共有できる情報が制限される。
  • 著者らは、分散型の逐次ベストレスポンス(Iterative Best Response: IBR)方策を提案する。各アージェントは、局所的に観測される厚生(ウェルフェア)への限界貢献を最大化する作業を貪欲に選択する。
  • 最大100機のドローンを用いた都市スケールの配送シミュレーションにおいて、IBRをEDD、ハンガリアン割当、SCoBAと比較し、作業到着パターンの違いごとに評価する。
  • 結果として、IBRはフル通信および疎通信の双方のもとで競争力のある性能を示し、ベースラインに比べて計算時間を削減できることが示される。

Abstract

本研究では、不確実なタスク完了、時間ウィンドウ制約、ならびに不完全情報の下での動的マルチロボット・タスク割当てを扱う。タスクは有限のホライズン上でオンラインで到着し、指定された締切までに完了されなければならない。一方、エージェントは、限られたセンシングと通信を備えた分散ハブから運用される。タスクの可視性を決定するハブベースのセンシング領域によって不完全情報をモデル化し、さらにハブ間の情報交換を支配する通信グラフを導入する。この枠組みに基づき、各エージェントが局所的に観測された厚生に対する限界貢献を最大化するタスクを選択する分散型方策である Iterative Best Response(IBR)を提案する。IBRを3つのベースライン、すなわち Earliest Due Date(EDD)first、ハンガリアン法、Stochastic Conflict-Based Allocation(SCoBA)と比較する。比較は最大100機のドローンと、到着シナリオの異なるタスク到着状況を用いた、市規模の配送(パッケージ配達)領域において行う。完全通信および疎通信の双方の条件下で、IBRは計算時間がより少ないにもかかわらず、競争力のあるタスク完了性能を達成する。

不確実性および通信制約下におけるダイナミックな多ロボット作業割当:ゲーム理論的アプローチ | AI Navigate