6週間前、ここで「Your Agent Has Two Logs. One of Them Doesn't Exist Yet.」というタイトルの投稿を公開しました。
今週、Band Bがクローズしました。COREの2本目のログが存在します。
ここでそれが実際に何を意味するのか、そしてそれを即座にクローズすると物事がなぜ難しくなったのかを説明します。
2ログ問題(簡潔に)
本番コードに触れるあらゆる自律システムには、認めていようといまいと2本のログがあります。
ログ1: 何が起きたか。ファイルが変更された、テストが実行された、コミットが着地した。
ログ2: なぜそれが起きたか。どの発見が、どの提案を引き起こしたか。どの承認が、どの実行を許可したか。どの実行が、どのファイル変更を引き起こしたか。どのファイル変更が、どの新しい発見を生み出したか。
ログ2は監査証跡(audit trail)です。規制された環境では、ログ2は任意ではありません。防御できるシステムと、防御できないシステムとの差になります。
COREにはログ1がありました。ログ2は欠けていました。
Band Bが実際に要求していたもの
8つの課題。4つのADR。7つの調整された書き込みパスの判断——帰属(attribution)はコードのどこに書き込まれるのか、どんな形になるのか、どのゲートによって保証されるのか。
大変だったのはコードではありません。因果関係のチェーンを完全にすることでした。すべてのリンクが必要でした:
- 発見 → それを主張(claim)した提案(いつ)
- 提案 → それを消費(consume)した実行(そしてどのコミットが結果として生まれたか)
- 実行 → それが生み出した新しい発見
1つでもリンクを落とすと、そのチェーンは装飾であって証拠ではありません。
4月の196コミット。25件の課題をクローズ。Band B:8クローズ、0オープン。
その直後に何が起きたか
Band Dが18件の課題とともにオープンしました。
後退(リグレッション)を導入したからではありません。Band Bをクローズしたことで、エンジンの整合性(integrity)上のギャップが、以前よりもはっきり見えるようになったからです。帰属の忠実性は、帰属が存在して初めて測れます。存在した瞬間、それが正しく書き込まれていない箇所がどこなのかを正確に見られるようになります。
これは収束(convergence)の原理が、設計どおりに機能していることを示しています。システムはより能力が高まります。その結果、システムは自分自身についてより多くの問題を即座に見つけます。監査PASSは成立しています——19人のアクティブなワーカー、発見はガバナンスの失敗ではなくモジュール性に関する警告です。しかし、バンドがクローズしても作業キューは縮まりません。変わるだけです。
「GxPで必要不可欠(load-bearing)」が実際に意味すること
私は、COREを部分的に、医薬品製造のような環境向けにも構築してきました。そこでは、コードや設定を修正するAIシステムが、許可された範囲内で、許可された意図のもとで行動したことを、完全な監査証跡とともに示す必要があります。
GxP(適正実施規制)は、あなたのシステムができることを気にしません。システムが行ったと証明できることを気にします。
Band Bは、COREが「能力のあるツール」であることと、「防御できるツール」であることの違いです。2本目のログが、防御可能性を作ります。
次は何か
Band D:エンジンの整合性。オープン中の課題は18件。完全な監査証跡を持つようになったシステムは、そのトレースが完全に信頼できる状態になるまでに、エンジンをさらに締める(tightenする)必要があります。
その次がBand E:外部バリデーション。COREが、自社で構築していないリポジトリを統治(govern)します。
2本目のログは存在します。今度は、それが記録するすべてが真実であることを確認します。
COREはオープンソースです: github.com/DariuszNewecki/CORE
このシリーズの前回: Your Agent Has Two Logs. One of Them Doesn't Exist Yet.




