OOWM:オブジェクト指向のプログラマブルな世界モデルによって、体性感覚にもとづく推論と計画を構造化する
arXiv cs.AI / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的なChain-of-Thoughtのプロンプトが、体性感覚ロボティクスに対しては限界があると主張する。なぜなら、線形テキストでは、計画に必要な状態空間、オブジェクト階層、因果的な依存関係が明示的にモデル化されないからである。
- それに対して、Object-Oriented World Modeling(OOWM)を提案し、世界モデルを明示的なシンボリックなタプル W=⟨S,T⟩として定義する。ここでは、状態の抽象化と遷移/制御ロジックを分離して扱い、UMLのクラス図およびアクティビティ図にもとづいて基礎づける。
- OOWMは、教師あり微調整とGroup Relative Policy Optimization(GRPO)を組み合わせる3段階の学習パイプラインを導入する。疎なアノテーションでも、結果(アウトカム)にもとづく報酬によってオブジェクト指向の推論構造を暗黙的に最適化する。
- MRoom-30kベンチマークでの実験では、非構造的なテキストベースラインに比べて、計画の一貫性、実行成功、構造的忠実性のいずれでも改善が報告されており、体性感覚にもとづく推論に対するより構造化されたパラダイムの可能性が示唆される。
- 本研究は、世界モデルを潜在ベクトル表現から、ソフトウェア工学のような形式へと作り替えることで、知覚・推論・実行可能な計画をより良く結びつけることを目的としている。




