リポジトリ上でオートリサーチを実行するためのClaude Code/Codexプラグイン「evo」

Dev.to / 2026/4/18

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

共有:

要点

ユーザーのリポジトリに対して、ベンチマークと実験を使った「オートリサーチ」風の最適化を行うオープンソースのClaude Code/Codexプラグイン「Evo」を紹介しています。
コードベースを受け取ると、ベンチマークを特定してベースラインを実行し、その後複数の並列エージェントが改良を試み、ベースラインを上回ったものだけを採用します。
オートリサーチの進め方は、貪欲なヒルクライムによるツリーサーチ、Git worktreeを用いた並列実行、失敗のトレース共有による同じミスの再発防止、そして回帰（regression）ゲートによる安全性担保で構造化されています。
各実験はGit worktreeのブランチとして実装され、スコア改善かつゲート通過の変更はコミットされ、回帰は破棄してクリーンアップされ、ローカルダッシュボードで観測可能です。
Claude Codeのプラグインマーケットプレイスから追加・インストールでき、Apache 2.0ライセンスで、Claude Codeが持つAPIキー以外の追加手続きやサインアップは不要とされています。

私は

自動リサーチにのめり込んでいる方、または自動リサーチを始めたいけれどどうすればいいのかわからない方のために作りました。これは、実験によってコードを最適化するオープンソースの Claude Code & Codex プラグインです。

あなたはコードベースを渡します。ベンチマークを見つけて、ベースラインを実行し、その後、それを上回るための並列エージェントを起動します。より良ければ保持し、悪ければ破棄します。

karpathy の自動リサーチに触発されていますが、上に構造があります：