自律エージェントにおける内在的および道具的自己保存の検出: 統一継続関心プロトコル
arXiv cs.AI / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- UCIPは、量子ボルツマンマシンを用いて潜在的軌道を分析することにより、自律エージェントにおける終端継続目標と道具的継続を区別する、複数基準の検出フレームワークを提供します。
- UCIPは軌道を量子ボルツマンマシンで符号化し、還元密度行列のフォン・ノーメンエントロピーを用いて分割間のエンタングルメントを定量化し、エンタングルメントと継続の重み付けを関連付けます。
- 真の目標を持つグリッドワールド実験では、UCIPは保持データの非対戦的評価で100%の検出精度と1.0のAUC-ROCを達成し、エンタングルメントギャップ Delta = 0.381 (p < 0.001) と、11点の補間スイープ全体での高いピアソン相関 (r = 0.934) を示しました。
- すべての計算は古典的であり、「量子」という語は数学的形式論に過ぎない。UCIPは意識や主観的経験を検出するものではなく、既知の目的と相関する潜在表現の統計的構造を検出します。
自律エージェント、特にメモリ、持続的コンテキスト、そして多段階計画を備えた委任システムは、状態を持たないモデルには存在しない測定問題を提起します。すなわち、終端目的として継続運用を保持するエージェントと、それを道具的にのみ行うエージェントは、観測的には似通った軌跡を生み出すことがあります。外部の行動モニタリングだけでは、それらを信頼性高く区別することはできません。我々は、挙動からエージェントの軌道の潜在構造へこの区別を移す、複数基準の検出フレームワークである統一継続関心プロトコル(UCIP)を導入します。UCIPは、量子ボルツマンマシン(QBM)を用いて軌道を符号化します。これは量子統計力学の密度行列形式に基づく古典的アルゴリズムで、隠れユニットを二分割して生じる還元密度行列のフォン・ノーメンエントロピーを測定します。
終端継続目的を持つエージェント(タイプA)が、道具的継続のみを行うエージェント(タイプB)よりも高いエンタングルメントエントロピーを持つ潜在状態を生み出すかどうかを検証します。より高いエンタングルメントは、分割間の統計的結合がより強いことを反映します。
真の目標を持つグリッドワールドエージェントでの実験では、UCIPは保持データの非対戦的評価において100%の検出精度と1.0のAUC-ROCを達成し、Phase I ゲートが凍結された状態でのエンタングルメントギャップ Delta = 0.381(p < 0.001、置換検定)を示します。11点間の補間スイープ全体でのピアソン相関 r = 0.934 は、この合成ファミリ内で、UCIP が二値ラベルだけでなく継続の重み付けを段階的に追跡していることを示します。テストされたモデルの中で、Deltaが正となるのはQBMのみでした。すべての計算は古典的であり、「量子」という語は数学的形式論に過ぎません。UCIPは意識や主観的経験を検出するものではなく、既知の目的と相関する潜在表現の統計的構造を検出します。