Mash, Spread, Slice! 視覚的空間的進行を用いた物体状態操作の学習
arXiv cs.RO / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- SPARTA は、物体の位置を単純に変えるだけでなく、マッシュ(潰す)、広げる、スライスといった連続的な物体状態の変化を扱う、統一的な物体状態変更操作タスクのフレームワークである。
- 空間的に進行する、物体中心の変化を、実行可能な状態から変換後の状態へ遷移する領域として表現し、構造化されたポリシー観測と密な報酬を可能にする。
- このフレームワークは、デモやシミュレーションを用いずに細粒度の制御を実現する強化学習と、迅速で軽量な展開を可能にする貪欲(グリーディ)制御という2つのポリシーのバリエーションを提供する。
- 実機ロボット上で、10種類の多様な物体に対し検証を行い、スパース報酬および視覚ゴール条件付きベースラインと比較して、訓練時間と精度の著しい改善を達成した。
- この結果は、進行を意識した視覚表現が、物体状態操作タスクのより広い系統に対して汎用性の高い基盤となり得ることを示唆しており、詳細はプロジェクト公式サイトに掲載されている。