dWorldEval：離散拡散ワールドモデルによるスケーラブルなロボティクス方策評価

arXiv cs.RO / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

本論文では、ロボティクス方策をあらゆる環境・タスクで逐次実行して評価するのが困難であることを背景に、離散拡散ワールドモデルを評価プロキシとして用いる dWorldEval を提案する。
dWorldEval は、視覚・言語・ロボットの行動といった複数モーダルを単一のトークン空間に統合し、1つのトランスフォーマ型デノイジングネットワークでそれらをモデル化する。
空間的・時間的な整合性を保つため、スパースなキーフレーム・メモリを導入し、さらにタスク完了度を示す進捗トークンも提案する。
推論時には将来の観測と進捗トークンを同時に予測し、進捗が1に到達した時点で自動的に成功を判定できる。
実験では、LIBERO、RoboTwin、複数の実ロボットタスクにおいて、既存手法（WorldEval、Ctrl-World、WorldGym など）を大きく上回り、ロボティクス評価のためのスケール可能なワールドシミュレータ構築に新しい建築パラダイムを示している。