ランダムなおもちゃで遊ぶことで、何でも掴むことを学ぶ

arXiv cs.RO / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文はロボットによる把持(マニピュレーション)における重要な制約、すなわち把持ポリシーが新規の物体へ一般化できず、その結果として実環境での有用性が低下している点を扱っている。
  • 少数の「ランダムなおもちゃ」(球・直方体・円柱・リングという4つの単純な形状プリミティブから組み立てたもの)を用いることで、ロボットが広く一般化可能な把持を学習できることを提案する。
  • 著者らは、検出プーリング機構によって作られる物体中心の視覚表現が、実世界の物体に対する堅牢なゼロショット一般化を可能にする決定的な要因であることを特定している。
  • シミュレーションおよび実機ロボット実験の両方で、この手法はYCBデータセットにおいて実環境での把持成功率67%を達成し、はるかに多くの領域内データを必要とする最先端手法を上回る。
  • 本研究ではスケーリング挙動も分析しており、学習用のトレーニングおもちゃの数/多様性、ならびに1つのおもちゃあたりのデモンストレーション数によって性能がどのように変化するかを示している。また、再利用のためにコード/チェックポイント/データセットを公開する。