EvolvingAgent:連続的ワールドモデルを備えたカリキュラム自己進化エージェントによる長期タスクの達成
arXiv cs.RO / 2026/4/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、EvolvingAgentという、ヒトの介入なしにオープンエンドな環境で長期(long-horizon)タスクを自律的に達成するための身体性エージェントを提案している。
- 既存手法の2つの弱点、すなわち人が作成したカリキュラムやマルチモーダル経験への依存、そして新しいタスクに直面した際の壊滅的忘却による世界知識の更新失敗に対処する。
- EvolvingAgentは、LLMベースのタスク計画モジュール、マルチモーダル経験を自己検証で更新するワールドモデル誘導の行動制御モジュール、タスク適応的なワールドモデル更新のために経験を選別するカリキュラム学習リフレクタの3モジュールを閉ループで構成する。
- 実験ではMinecraftで平均成功率が最大111.74%改善し、無効な行動は6倍以上(6×超)削減され、さらにAtari環境にも一般化し、人間レベルの性能を示した。
- まとめると、本研究は、自己計画・自己制御・自己リフレクションと、継続的なマルチモーダルのワールドモデリングを組み合わせることで、長期の身体性タスク性能を大きく引き上げられることを示している。




