[P] コールドバリデーション：共有コンテキストなしであるAIエージェントが別のAIエージェントを監査するオープンソース・システム

Reddit r/MachineLearning / 2026/3/25

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

共有:

要点

この記事は、ビルダー・エージェントとレビューアー・エージェントを厳格に分離することで、AIエージェントの出力を独立して検証するオープンソースの「コールドバリデーション」アーキテクチャを発表します。
フェーズゲート式のオーケストレーションを採用し、ビルダー（Claude Code）が計画とコードを生成する一方、レビューアー（Codex CLI）はビルダーの推論にアクセスせず、生成された成果物のみを監査します。
レビューアーは、より広範なリポジトリの文脈にアクセスできないようにするため、ファイルシステムを隔離した環境（例：一時ディレクトリ）で実行し、情報漏えいやバイアスの低減を図ります。
検証ラウンドをまたいだ知見を、耐久性のあるフィンガープリントによって追跡し、35の機械的テストによって裏付けられた「ブロッキングとなる知見」との照合により判定を整合させるためのコントローラを用います。
本システムはApache 2.0でリリースされており、GitHubリポジトリへのリンクと、より深い技術的解説へのリンクが提示されています。

独立したAIエージェントの検証のためのオープンソースのアーキテクチャを公開しました。中核となる考え方はこうです。何かを作ったエージェントは、それをレビューしてはならない。冷間バリデーションでは、厳格に分離された2つのエージェントを使います。- ビルダー（Claude Code）が計画とコードを生成する - レビュアー（Codex CLI）は成果物のみを監査する——推論は一切見ない - オーケストレータがフェーズゲートと収束を強制する レビュアーはファイルシステムを隔離して実行します（テンポラリディレクトリ、リポジトリへのアクセスなし）。所見は、ラウンドをまたいで耐久性のあるフィンガープリントとして追跡されます。コントローラは、ブロッキングとなる所見に対して独立に判定を照合（リコンシル）します。Apache 2.0。35の機械的テスト。

GitHub: https://github.com/raxe-ai/cold-validation-architecture

詳細: https://raxe.ai/labs/cold-validation

投稿者: /u/cyberamyntas
[リンク] [コメント]