PALM:アフォーダンス推論による長期ロボットマニピュレーションのための進捗認識型ポリシー学習
arXiv cs.RO / 2026/4/7
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- PALMは、相互作用中心のアフォーダンス推論と明示的なサブタスク進捗トラッキングを追加することで、長期・多段階のロボットマニピュレーションを改善する新しいビジョン言語アクション(VLA)フレームワークである。
- 本手法は、物体の関連性、接触幾何、空間配置、運動ダイナミクスといった複数の補完的なアフォーダンス表現を蒸留し、ビジュオモータ制御のためのタスク関連アンカーとして機能させる。
- PALMは、サブタスク内の進捗を連続量として予測することで、同じ行動の繰り返し、手順の見落とし、早すぎる終了といった実行失敗を減らし、サブタスク間のより滑らかな遷移を可能にする。
- 広範なシミュレーションおよび実環境ベンチマークでの実験により、PALMはベースラインを上回り、LIBERO-LONGで成功率91.8%を達成し、CALVIN(ABC→D)では平均長さで12.5%の改善を示し、さらに3つの長期汎化設定において実環境ベースラインに対して約2倍の向上が見られた。




