Train-Small Deploy-Large:拡散モデルに基づくマルチロボット計画の活用

arXiv cs.RO / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 既存の学習ベースのマルチロボット経路計画は、訓練時のロボット数に固定されがちで、配備時にロボット数が増える状況で一般化できない課題がある。
  • 本論文では、ダイナミックに変化するエージェント数に対応可能な拡散モデルベースのプランナーを提案し、少数エージェントで学習して大規模エージェントへ展開できる「train small deploy large」方針を実現する。
  • 共有の拡散モデルに、相互注意(inter-agent attention)計算と時間的畳み込み(temporal convolution)を組み合わせることで、精度を維持しつつスケール性能を高める。
  • 複数のシナリオで検証し、従来のマルチエージェント強化学習手法やヒューリスティック制御と比較して有効性を示している。

Abstract

学習ベースのマルチロボット経路計画手法は、スケールさせたり変化に一般化したりすることが難しく、特に配備時のロボット数の変動に弱いという課題があります。既存のほとんどの手法は固定されたロボット数で学習されており、検証(テスト)時にロボット数が減少する程度なら許容できる場合がありますが、ロボット数が増加すると典型的には失敗します。さらに、より多くのエージェントに対してこれらの手法を学習することは、時間的にも計算的にも負担が大きくなります。一方で、解析的手法は計算面でのスケールや環境における動的な変化の取り扱いに苦労することがあります。本研究では、動的に変動するエージェント数を扱える拡散モデルベースのプランナーを活用することを提案します。提案手法は限られた数のエージェントで学習され、配備時にはより多いエージェント数へ効果的に一般化します。結果として、単一の共有された拡散モデルベースのプランナーに、専用のエージェント間注意(inter-agent attention)計算と時間畳み込み(temporal convolution)を組み合わせることで、精度の良い「小さく学習して大きく配備する(train small deploy-large)」パラダイムを実現できることが示されます。複数のシナリオにわたって本手法を検証し、既存のマルチエージェント強化学習手法およびヒューリスティックな制御に基づく手法と性能を比較します。