Goal2Skill:適応的計画と振り返りによる長期ホライズン・マニピュレーション

arXiv cs.RO / 2026/4/16

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • Goal2Skillは、部分観測性、遮蔽、失敗しやすい多段タスクに起因する脆さを解決する、長期ホライズンの身体性(embodied)マニピュレーションのための提案デュアルシステムフレームワークである。
  • この手法は、高レベルのセマンティック推論(構造化されたタスクメモリ、目標分解、結果検証、エラー駆動の修正を備えたVLMベースのエージェント的プランナー)と、低レベルのモータ実行(拡散ベースの行動生成を用いるVLAベースの視覚運動コントローラ)を分離する。
  • 計画–実行の閉ループを形成し、メモリを意識した推論、適応的な再計画、実行失敗からの明示的なオンライン回復を可能にする。
  • RMBenchでの実験では大きな性能向上が示され、最強のベースライン(9.8%)に対して平均成功率32.4%を達成している。
  • アブレーション結果から、構造化メモリと閉ループ回復が、長期ホライズン・マニピュレーション性能の改善における主要な寄与要因であることが示される。