強化学習とインコンテキストのビジョン・言語モデルによる階層型DLOルーティング
arXiv cs.RO / 2026/4/16
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、変形可能な線状物体(例:ケーブルやロープ)の長期ホライズンなルーティングに対して、長期計画と信頼性の高いマルチスキル実行を必要とする状況を対象にした、完全自律型の階層的フレームワークを提示する。
- 言語で指定されたルーティング目標を、インコンテキスト推論のためのビジョン・言語モデルを用いて高レベルの計画へと変換し、その後、強化学習によって低レベルの操作スキルを実行する。
- 長期ホライズンにわたる頑健性を扱うため、この手法には、誤りが起きた際にDLOを挿入可能な状態へ再配向(リオリエント)する失敗回復メカニズムが含まれる。
- 本アプローチは、多様なシーンやコマンドスタイル(暗黙的な言語や空間記述を含む)にわたって一般化できることが報告され、長期ホライズンのルーティング課題において総合成功率92%を達成する。
- 本研究にはプロジェクトページが付属し、arXivのアップデートとしても説明されており、変形可能物体のロボット操作に関する応用研究として位置づけられている。




