RISE:合成的ワールドモデルによる自己改善型ロボット方策
arXiv cs.RO / 2026/4/29
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、接触が多くダイナミックな物体操作タスクにおいて、軽微な実行ずれが失敗へ連鎖しやすいVision-Language-Action(VLA)方策の頑健性を高めることを目的に、RISEという枠組みを提案しています。
- RISEは、制御可能なダイナミクスでマルチビューの将来状態を予測するコンポジショナル(合成的)ワールドモデルと、想像上の結果をスコアして有益なadvantage(優位度)を計算する進捗/価値モデルを中核に据えています。
- 状態の予測と価値評価を分離し、それぞれ異なるアーキテクチャと目的に最適化することで、両者をうまく調整できる設計になっています。
- 閉ループの「自己改善」パイプラインとして、想像上のロールアウトを繰り返し生成し、advantageを推定して、方策更新を“想像の空間”内で行うため、危険でコストの高いオンポリシーの物理実験を減らせます。
- 3つの実世界タスクでの評価では、従来手法より大きな改善が示され、ダイナミックなブロック仕分けで+35%以上、バックパック詰め込みで+45%、箱の閉じ作業で+35%以上の絶対性能向上が報告されています。


