dWorldEval:離散拡散ワールドモデルによるスケーラブルなロボティクス方策評価
arXiv cs.RO / 2026/4/27
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文では、ロボティクス方策をあらゆる環境・タスクで逐次実行して評価するのが困難であることを背景に、離散拡散ワールドモデルを評価プロキシとして用いる dWorldEval を提案する。
- dWorldEval は、視覚・言語・ロボットの行動といった複数モーダルを単一のトークン空間に統合し、1つのトランスフォーマ型デノイジングネットワークでそれらをモデル化する。
- 空間的・時間的な整合性を保つため、スパースなキーフレーム・メモリを導入し、さらにタスク完了度を示す進捗トークンも提案する。
- 推論時には将来の観測と進捗トークンを同時に予測し、進捗が1に到達した時点で自動的に成功を判定できる。
- 実験では、LIBERO、RoboTwin、複数の実ロボットタスクにおいて、既存手法(WorldEval、Ctrl-World、WorldGym など)を大きく上回り、ロボティクス評価のためのスケール可能なワールドシミュレータ構築に新しい建築パラダイムを示している。




