Train-Small Deploy-Large：拡散モデルに基づくマルチロボット計画の活用

arXiv cs.RO / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

既存の学習ベースのマルチロボット経路計画は、訓練時のロボット数に固定されがちで、配備時にロボット数が増える状況で一般化できない課題がある。
本論文では、ダイナミックに変化するエージェント数に対応可能な拡散モデルベースのプランナーを提案し、少数エージェントで学習して大規模エージェントへ展開できる「train small deploy large」方針を実現する。
共有の拡散モデルに、相互注意（inter-agent attention）計算と時間的畳み込み（temporal convolution）を組み合わせることで、精度を維持しつつスケール性能を高める。
複数のシナリオで検証し、従来のマルチエージェント強化学習手法やヒューリスティック制御と比較して有効性を示している。

Abstract

学習ベースのマルチロボット経路計画手法は、スケールさせたり変化に一般化したりすることが難しく、特に配備時のロボット数の変動に弱いという課題があります。既存のほとんどの手法は固定されたロボット数で学習されており、検証（テスト）時にロボット数が減少する程度なら許容できる場合がありますが、ロボット数が増加すると典型的には失敗します。さらに、より多くのエージェントに対してこれらの手法を学習することは、時間的にも計算的にも負担が大きくなります。一方で、解析的手法は計算面でのスケールや環境における動的な変化の取り扱いに苦労することがあります。本研究では、動的に変動するエージェント数を扱える拡散モデルベースのプランナーを活用することを提案します。提案手法は限られた数のエージェントで学習され、配備時にはより多いエージェント数へ効果的に一般化します。結果として、単一の共有された拡散モデルベースのプランナーに、専用のエージェント間注意（inter-agent attention）計算と時間畳み込み（temporal convolution）を組み合わせることで、精度の良い「小さく学習して大きく配備する（train small deploy-large）」パラダイムを実現できることが示されます。複数のシナリオにわたって本手法を検証し、既存のマルチエージェント強化学習手法およびヒューリスティックな制御に基づく手法と性能を比較します。

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

なぜAnthropicの新モデルがサイバーセキュリティの専門家を動揺させているのか

Reddit r/artificial

AI 2027の論文は、いまもなお正当性を持っているのか？

Reddit r/artificial

なぜほとんどの生産性システムが失敗するのか（そして代わりに何をすべきか）

Dev.to

Train-Small Deploy-Large：拡散モデルに基づくマルチロボット計画の活用

要点

Abstract

関連記事

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

なぜAnthropicの新モデルがサイバーセキュリティの専門家を動揺させているのか

AI 2027の論文は、いまもなお正当性を持っているのか？

なぜほとんどの生産性システムが失敗するのか（そして代わりに何をすべきか）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer