COvolve: Adversarial Co-Evolution of Large-Language-Model-Generated Policies and Environments via Two-Player Zero-Sum Game
arXiv cs.AI / 3/31/2026
📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- COvolveは、LLMにより「環境(環境コード)」と「エージェント方策(方策コード)」の双方を自動生成し、静的/手作業の学習環境という課題を解決しようとする共進化フレームワークです。
- 環境設計者と方策設計者の相互作用を二者ゼロ和ゲームとして定式化し、環境が方策の弱点を突くように生成され、方策がそれに適応するように共進化が進みます。
- 共進化により環境と方策が協調して複雑さを増していく自動カリキュラムを誘導し、事前にタスク分布を定義しないオープンエンド学習を目指します。
- ロバスト性と忘却の抑制のため、ゼロ和ゲームの混合戦略ナッシュ均衡(MSNE)を計算し、複数環境に対するメタポリシーを得て、既知環境の解法を保持しつつ未知環境にも対応します。
- 都市運転、記号的迷路、幾何学ナビゲーションの実験で、LLM駆動の共進化が段階的により複雑な環境を生成し得ることを示しています。
Related Articles

Black Hat Asia
AI Business

How to Verify Information Online and Avoid Fake Content
Dev.to

I built an AI code reviewer solo while working full-time — honest post-launch breakdown
Dev.to

Why Your State Management Is Slowing Down AI-Assisted Development
Dev.to
Google Stitch vs Claude: Which AI Design Tool Wins in 2026?
Dev.to