ゼロショットの世界モデルは発達的に効率的な学習者である
arXiv cs.AI / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、限られた学習データで幼い子どもが柔軟な身体理解を獲得する仕組みを説明するための計算仮説として、ゼロショット視覚世界モデル(ZWM)を提案する。
- ZWMは3つの原理に基づいて構築される:見た目とダイナミクスを分離する疎な時間的因子分解型予測器、近似的な因果推論によるゼロショット推定、そして合成推論によってより複雑な能力へとスケールすること。
- 著者らは、ZWMが単一の子どもの一人称体験から学習でき、その後複数の身体理解ベンチマークで急速に性能を発揮することを報告している。
- 結果は、子どもの発達に見られる行動的な兆候と一致するだけでなく、脳のような内部表象を生成するとも主張されており、このアプローチは、人間規模のデータからデータ効率よく学習するAIのための設計図として位置づけられている。




