要旨: 団体の意思決定――規制順守、臨床トリアージ、事前承認の異議申立て――は、汎用エージェントが提供するものとは異なるAIアーキテクチャを必要とします。エージェントのフレームワークは会話を通じて権限を推論し、ログから説明責任を再構成し、そして沈黙した誤りを生成します。すなわち、誤った判断が、何ら人間のレビューを促すシグナルなしに実行されるのです。私たちは、認知コア(Cognitive Core)を提案します。これは、9つの型付き認知プリミティブ(retrieve, classify, investigate, verify, challenge, reflect, deliberate, govern, generate)から構築され、計算に内生する改ざん検知可能なSHA-256ハッシュチェーンの監査台帳を備え、人間によるレビューが事後のチェックではなく実行の条件となる、4層のガバナンスモデルを備えます。さらに、宣言された推論系列と、自律的に推論されたエピステミック(認識論的)系列の両方を支える、要求駆動型の委譲アーキテクチャを備えています。
私たちは、11件からなるバランスの取れた事前承認異議申立ての評価セットで、3つのシステムをベンチマークします。認知コアは、55%(ReAct)および45%(Plan-and-Solve)に対して91%の精度を達成します。ガバナンスの結果はさらに重要です。CCは沈黙した誤りをゼロにしたのに対し、両方のベースラインは5〜6件でした。私たちは、システムが自律的に行動してはいけないときに、それをどれだけ確実に「知っているか」を表すガバナビリティ(governability)を、精度と並ぶ制度向けAIの主要評価軸として導入します。ベースラインは、プロンプトとして実装しており、ガバンド(governed)な枠組みに代わる現実的な導入選択肢を表しています。構成駆動のドメインモデルにより、新しい制度上の意思決定ドメインを導入するにはエンジニアリング能力ではなくYAMLの設定が必要になります。




