ESPADA:模倣学習のためのセマンティクス認識デモデータのダウンサンプリングによる実行速度向上
arXiv cs.RO / 2026/4/28
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、行動クローン(behavior cloning)に基づくビジュオモータ方策について、人のデモに引きずられた過度に慎重なタイミングを保ちつつ精度を落とさないことを目的に、デモデータをセマンティクスおよび空間的に意識してダウンサンプリングする手法ESPADAを提案します。
- ESPADAは、VLM-LLMパイプラインと3Dのグリッパー—物体関係を用いてデモをセグメント化し、重要でない区間では強めにダウンサンプリングしつつ、精度が必要な重要区間は保持します。
- 追加データ、アーキテクチャ変更、再学習を不要とし、1エピソード分の注釈からデータセット全体へは、ダイナミクスのみの特徴を使ったDTW(Dynamic Time Warping)でセグメントラベルを伝播させてスケールします。
- シミュレーションと実世界の両方で、ACTおよびDPのベースラインを用いた実験により、約2倍の速度向上を達成しつつ成功率を維持し、人間デモと効率的なロボット制御のギャップを縮めることを示します。




