概要: 効率的なロボティクスによる地球外探査には、科学計測ツールから高度な移動(ロコモーション)まで、多様な能力を備えたロボットが必要です。ロボットのチームを組むことで、複数の専門化されたサブシステムにタスクを分散でき、それぞれがミッション完遂に向けて特定の専門知識を提供します。中心となる課題は、チームを効率よく協調させて利用率を最大化し、科学的価値を最大限に引き出すことにあります。従来の計画(プランニング)アルゴリズムは問題規模に対してスケールしにくく、その結果、計画サイクルが長くなり、可能なロボットとターゲットの割り当て、および可能な軌道の組合せ的な増大により推論コストが高くなります。学習ベースの手法は、このスケーリング上の懸念を実行時(ランタイム)から学習時間へ移すための有力な代替手段であり、リアルタイム計画の実現に向けた重要な一歩となります。本研究では、多エージェント近接方策最適化(Multi-Agent Proximal Policy Optimization; MAPPO)に基づく協調計画戦略を提案し、不均質なロボットのチームを協調させて、複雑なターゲット割り当てとスケジューリング問題を解く方法を示します。提案手法を、全探索によって得られる単一目的の最適解と比較してベンチマークし、惑星探査シナリオの文脈においてオンライン再計画を実行できる能力を評価します。
マルチエージェントPPOを用いた異種ロボットチームのための協調タスク割り当ておよび経路計画
arXiv cs.RO / 2026/4/2
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ロボットが多様な能力(例:科学計測器と移動機能など)を持つ、宇宙外/惑星探査において、異種のマルチロボットチームがどのように効果的に協調できるかを扱う。
- 中核となる問題を、目標(ターゲット)の割り当てとスケジューリングとして定式化し、古典的な計画手法は、ロボット—ターゲットの割り当ておよび経路の組合せ的な増大によりスケールしにくい点を強調する。
- 著者らは、マルチエージェント・近似プロキシマル政策最適化(MAPPO)を用いた協調計画戦略を提案し、計算スケーリングを推論(推定)時ではなく学習時へ移すことで、より実用的なリアルタイムの再計画を可能にする。
- 全探索に基づく単一目的の最適解とベンチマークし、惑星探査シナリオ内のオンライン再計画設定における性能を検証する。


