[P] コールドバリデーション:共有コンテキストなしであるAIエージェントが別のAIエージェントを監査するオープンソース・システム

Reddit r/MachineLearning / 2026/3/25

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • この記事は、ビルダー・エージェントとレビューアー・エージェントを厳格に分離することで、AIエージェントの出力を独立して検証するオープンソースの「コールドバリデーション」アーキテクチャを発表します。
  • フェーズゲート式のオーケストレーションを採用し、ビルダー(Claude Code)が計画とコードを生成する一方、レビューアー(Codex CLI)はビルダーの推論にアクセスせず、生成された成果物のみを監査します。
  • レビューアーは、より広範なリポジトリの文脈にアクセスできないようにするため、ファイルシステムを隔離した環境(例:一時ディレクトリ)で実行し、情報漏えいやバイアスの低減を図ります。
  • 検証ラウンドをまたいだ知見を、耐久性のあるフィンガープリントによって追跡し、35の機械的テストによって裏付けられた「ブロッキングとなる知見」との照合により判定を整合させるためのコントローラを用います。
  • 本システムはApache 2.0でリリースされており、GitHubリポジトリへのリンクと、より深い技術的解説へのリンクが提示されています。
独立したAIエージェントの検証のためのオープンソースのアーキテクチャを公開しました。中核となる考え方はこうです。何かを作ったエージェントは、それをレビューしてはならない。冷間バリデーションでは、厳格に分離された2つのエージェントを使います。- ビルダー(Claude Code)が計画とコードを生成する - レビュアー(Codex CLI)は成果物のみを監査する——推論は一切見ない - オーケストレータがフェーズゲートと収束を強制する レビュアーはファイルシステムを隔離して実行します(テンポラリディレクトリ、リポジトリへのアクセスなし)。所見は、ラウンドをまたいで耐久性のあるフィンガープリントとして追跡されます。コントローラは、ブロッキングとなる所見に対して独立に判定を照合(リコンシル)します。Apache 2.0。35の機械的テスト。 

GitHub: https://github.com/raxe-ai/cold-validation-architecture

詳細: https://raxe.ai/labs/cold-validation

投稿者: /u/cyberamyntas
[リンク] [コメント]