dWorldEval:離散拡散ワールドモデルによるスケーラブルなロボティクス方策評価

arXiv cs.RO / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文では、ロボティクス方策をあらゆる環境・タスクで逐次実行して評価するのが困難であることを背景に、離散拡散ワールドモデルを評価プロキシとして用いる dWorldEval を提案する。
  • dWorldEval は、視覚・言語・ロボットの行動といった複数モーダルを単一のトークン空間に統合し、1つのトランスフォーマ型デノイジングネットワークでそれらをモデル化する。
  • 空間的・時間的な整合性を保つため、スパースなキーフレーム・メモリを導入し、さらにタスク完了度を示す進捗トークンも提案する。
  • 推論時には将来の観測と進捗トークンを同時に予測し、進捗が1に到達した時点で自動的に成功を判定できる。
  • 実験では、LIBERO、RoboTwin、複数の実ロボットタスクにおいて、既存手法(WorldEval、Ctrl-World、WorldGym など)を大きく上回り、ロボティクス評価のためのスケール可能なワールドシミュレータ構築に新しい建築パラダイムを示している。

dWorldEval:離散拡散ワールドモデルによるスケーラブルなロボティクス方策評価 | AI Navigate