異種の小型無人航空機フリート間におけるマルチエージェント強化学習による分離保証
arXiv cs.RO / 2026/5/5
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、密集した都市部の空域で異種の小型無人航空機(sUAS)フリートが運用される状況において、マルチエージェント強化学習が戦術的なデコンフリクションの均衡(コンフリクト回避の状態)を達成できるかを検討している。
- 主要な問いは2つであり、(1) 衝突のない分離を実現するための分離方策が収束して均衡に到達し得るか、(2) 収束した方策がより弱い構成のフリートを不利に扱うかどうかである。
- attention-enhanced PPOA2C(Proximal Policy OptimizationベースのAdvantage Actor-Critic)を用い、各フリートはプライバシーを保ったままそれぞれ独立に自分の方策を学習する枠組みを採用している。
- ダラス、テキサスでの荷物配送シナリオによる実験では、異なる2つのフリートが共有されたPPOA2C方策によって安全な分離のための均衡に到達でき、衝突解決の面で強力なルールベースのベースラインより優れていることが示されている。
- 方策と構成の大規模評価では、類似した方策タイプ同士の均衡ではより強い構成のフリートが有利になり得ること、また方策タイプが異なる場合でも均衡はどちらか一方に偏り得るため、公平性を考慮した衝突管理の必要性が示唆されている。




