SynAgent：ソロから協調へ—エージェント・シナジーによる汎用的な協調ヒューマノイド操作

arXiv cs.RO / 2026/4/22

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、単一エージェントの人間—物体相互作用のスキルを、複数エージェントの人間—物体—人間シナリオへと転移することで、スケーラブルかつ物理的に整合した協調ヒューマノイド操作を実現する統一的アプローチ「SynAgent」を提案しています。
動作転移の際にセマンティクス／空間関係を保つために、Delaunay の四面体分割で構築した Interact Mesh に基づく、相互作用を保全するリタゲティング手法を導入しています。
SynAgent は、豊富な単一ヒトデータから協調行動をブートストラップするための「単一エージェントの事前学習＋適応」パイプラインを用い、分散学習とマルチエージェント PPO を活用します。
安定した制御可能な実行のために、条件付き VAE による軌道条件付き生成ポリシーを開発し、モーション模倣の事前分布からのマルチティーチャー蒸留で学習させます。
実験では、SynAgent が協調模倣および軌道条件付き制御の双方で既存ベースラインを上回り、さらに多様な物体形状への一般化性能が高いことが示されています。

要旨: 制御可能な協調ヒューマノイドの操作は、データ不足の深刻さ、複数エージェントの協調に伴う複雑さ、物体間にわたる一般化の限界といった理由により、身体化された知能にとって基本的でありながらも難しい問題です。本論文では、SynAgent を提案します。SynAgent は、ソロエージェントから協調エージェントへのエージェント・シナジー（Solo-to-Cooperative Agent Synergy）を活用することで、単一エージェントの人-物相互作用から複数エージェントの人-物-人シナリオへ技能を移転し、スケーラブルで物理的にもっともらしい協調操作を可能にする統一的フレームワークです。運動転移の際に意味の整合性を維持するために、デローネ四面体分割により構築した Interact Mesh に基づく、相互作用を保持するリターゲティング手法を導入します。これにより、人間と物体の間の空間的関係を忠実に保持します。この洗練されたデータに基づき、単一エージェントの事前学習と適応のパラダイムを提案します。これは、分散型学習とマルチエージェント PPO により、大量の単一人間データからシナジーに基づく協調行動をブートストラップします。最後に、条件付き VAE を用いた、軌道条件付けの生成ポリシーを開発します。これは、運動模倣の事前分布からのマルチティーチャー蒸留によって学習され、物体レベルの軌道実行を安定かつ制御可能にします。広範な実験により、SynAgent が、協調模倣および軌道条件付け制御の双方において既存のベースラインを大幅に上回り、さまざまな物体形状にわたって一般化できることを示します。コードとデータは、出版後に公開されます。プロジェクトページ: http://yw0208.github.io/synagent