リポジトリ上でオートリサーチを実行するためのClaude Code/Codexプラグイン「evo」

Dev.to / 2026/4/18

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • ユーザーのリポジトリに対して、ベンチマークと実験を使った「オートリサーチ」風の最適化を行うオープンソースのClaude Code/Codexプラグイン「Evo」を紹介しています。
  • コードベースを受け取ると、ベンチマークを特定してベースラインを実行し、その後複数の並列エージェントが改良を試み、ベースラインを上回ったものだけを採用します。
  • オートリサーチの進め方は、貪欲なヒルクライムによるツリーサーチ、Git worktreeを用いた並列実行、失敗のトレース共有による同じミスの再発防止、そして回帰(regression)ゲートによる安全性担保で構造化されています。
  • 各実験はGit worktreeのブランチとして実装され、スコア改善かつゲート通過の変更はコミットされ、回帰は破棄してクリーンアップされ、ローカルダッシュボードで観測可能です。
  • Claude Codeのプラグインマーケットプレイスから追加・インストールでき、Apache 2.0ライセンスで、Claude Codeが持つAPIキー以外の追加手続きやサインアップは不要とされています。

私は

https://github.com/evo-hq/evo

自動リサーチにのめり込んでいる方、または自動リサーチを始めたいけれどどうすればいいのかわからない方のために作りました。これは、実験によってコードを最適化するオープンソースの Claude Code & Codex プラグインです。

あなたはコードベースを渡します。ベンチマークを見つけて、ベースラインを実行し、その後、それを上回るための並列エージェントを起動します。より良ければ保持し、悪ければ破棄します。

karpathy の自動リサーチに触発されていますが、上に構造があります:

  • 貪欲なヒルクライムに対するツリー探索 — 承認済みノードから複数のフォーク
  • git worktrees 内での N 並列エージェント
  • 共有された失敗トレース(エージェントが互いの失敗を繰り返さないように)
  • 回帰ゲート

内部では:各実験は、その親から分岐する git worktree です。スコア改善 + ゲート通過の場合にコミット。回帰が起きた場合は破棄し、worktree をクリーンアップします。すべてがローカルのダッシュボードで観測可能です。

Apache 2.0、サインアップ不要、Claude Code がすでに持っているもの以上の API キー不要:

/plugin marketplace add evo-hq/evo
/plugin install evo@evo-hq-evo