私は
自動リサーチにのめり込んでいる方、または自動リサーチを始めたいけれどどうすればいいのかわからない方のために作りました。これは、実験によってコードを最適化するオープンソースの Claude Code & Codex プラグインです。
あなたはコードベースを渡します。ベンチマークを見つけて、ベースラインを実行し、その後、それを上回るための並列エージェントを起動します。より良ければ保持し、悪ければ破棄します。
karpathy の自動リサーチに触発されていますが、上に構造があります:
- 貪欲なヒルクライムに対するツリー探索 — 承認済みノードから複数のフォーク
- git worktrees 内での N 並列エージェント
- 共有された失敗トレース(エージェントが互いの失敗を繰り返さないように)
- 回帰ゲート
内部では:各実験は、その親から分岐する git worktree です。スコア改善 + ゲート通過の場合にコミット。回帰が起きた場合は破棄し、worktree をクリーンアップします。すべてがローカルのダッシュボードで観測可能です。
Apache 2.0、サインアップ不要、Claude Code がすでに持っているもの以上の API キー不要:
/plugin marketplace add evo-hq/evo
/plugin install evo@evo-hq-evo




