模倣学習のための高精細な合成デモンストレーション作成に関する原理的アプローチ

arXiv cs.RO / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、模倣学習向けに合成デモンストレーションを生成する際、サンプリング型プランナや軌道最適化で新しい運動を作ることで生じがちな逸脱を抑え、専門家の軌道を維持することを原理として提案している。
専門家の軌道を強い事前知識として扱うため、Dynamic Movement Primitives（DMP）で軌道をモデル化し、再構成した3D Gaussian Splatting（3DGS）シーン内で、新しい目標・物体配置・視点に運動をリタゲットしても位相整合性と形状を保つようにする。
閉所や障害物がある状況で安全に実現するために、3DGSが誘導する連続的な密度場を直接用いる解析的な障害物対応DMPの定式化を導入し、衝突回避を行いつつ本来の専門家運動の摂動を最小限に抑える。
Spotモバイルマニピュレータで、軌道の忠実度に対する要求が増す3つの操作タスクを評価した結果、提案手法は軌道の逸脱や衝突率を低減し、拡散ベースの視覚モータポリシー学習でもタスク成功率を高めることを示している。

概要: 近年の3Dガウス・スパッティング（3DGS）における進歩により、単一の熟練者の軌跡と短い多視点スキャンから、視覚的に説得力のあるデモンストレーション生成が可能になってきました。しかし、既存の3DGSベースの合成パイプラインでは、新しいモーションを生成する際に、サンプリングベースの計画器や軌跡最適化に依存することが一般的であり、その結果として、熟練者が示した経路から大きく逸脱することがしばしばあります。このような逸脱は、モーション形状に鈍感なタスクでは許容され得るものの、接触が多い、あるいは形状に敏感な操作にとって重要な微妙な空間・時間構造を捨て去ってしまい、デモンストレーションの多様性が下流のポリシー学習を損なう原因になります。私たちは、デモンストレーション合成は熟練者の軌跡を強い事前知識（強い事前）として扱うべきだと主張します。この原則に基づき、熟練者のモーション構造を明示的に保持しながら、多様なタスクデモンストレーションを合成する枠組みを提案します。再構成された3DGSシーン内で、熟練者の軌跡をダイナミック・ムーブメント・プリミティブ（DMP）でモデル化し、それを新しい目標、物体の構成、および視点へとリタゲットすることで、位相の整合性があり、形状を保つモーションを構築時に生成します。さらに、散らかったシーンにおけるこの熟練者保持型の多様性を安全に実現するために、3DGS表現から誘導される連続密度場に直接作用する解析的な障害物を考慮したDMPの定式化を導入します。これにより、衝突回避を可能にしつつ、名目上の熟練者モーションへの摂動を最小限に抑えます。追加のシーン表現なしに、フォトリアルなレンダリングと幾何学的推論を統一することができます。提案手法を、3つの操作タスク（軌跡忠実度への感度が増していく）にわたって、Spotのモバイル・マニピュレータで評価します。計画器および最適化ベースの合成と比べて、私たちの手法は逸脱と衝突の発生率がより低い軌跡を生成し、拡散ベースのビジュオモータルポリシーを学習する際に高いタスク成功率をもたらします。