Springdrift:ケースベースのメモリ、規範的セーフティ、周辺的な自己知覚を備えた、監査可能な永続ランタイムとしてのLLMエージェント

arXiv cs.AI / 2026/4/7

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • Springdriftは、長期稼働するLLMエージェント向けの「永続ランタイム」で、追記型メモリや監督付きプロセス、gitベースの復旧により実行を監査可能にする仕組みを統合しています。
  • ケースベース推論に基づくメモリ層とハイブリッド検索(密ベースラインとしてコサイン類似度を評価)を組み合わせ、セッションを跨いだ文脈保持を狙っています。
  • 決定論的な規範(normative)計算による安全ゲーティングを導入し、どの公理に基づいて判断したかを監査可能な「公理トレイル」として残す設計です。
  • 自己状態(sensorium)をツール呼び出しなしで各サイクルに注入し、継続的な自己認識にもとづく自己診断・故障モード分類などを試みています。
  • 単一インスタンスを23日間(19稼働日)運用し、メール/ウェブ間での無指示の文脈維持や、自己のインフラ不具合診断・脆弱性特定などをケーススタディとして報告しています。

Abstract

我々は、長寿命のLLMエージェントのための永続的なランタイムであるSpringdriftを提示する。本システムは、監査可能な実行基盤(追記のみのメモリ、監督付きプロセス、gitにバックアップされた復旧)を統合し、評価済みの密なコサイン基準と比較したハイブリッド検索によるケースベース推論のメモリ層、監査可能な公理トレイルを伴う安全性ゲーティングのための決定的な規範計算、そしてツール呼び出しなしで各サイクルに注入される、構造化された自己状態表現(センサリウム)による連続的な周囲環境の自己認識を備える。これらの特性は、セッションに制約されたシステムでは達成しにくい振る舞いを支える:セッションをまたいだタスク継続、チャネルをまたいだ文脈維持、意思決定のエンドツーエンドな法科学的再構成、そして自己診断的な振る舞いである。我々は、23日間(稼働19日間)の単一インスタンスでのデプロイメントについて報告する。この期間中、エージェントは自身のインフラのバグを診断し、故障モードを分類し、アーキテクチャ上の脆弱性を特定し、明示的な指示なしに電子メールとWebの両チャネルにまたがって文脈を維持した。本カテゴリを指す用語としてArtificial Retainer(人間以外の保持者)を導入する:永続メモリ、定義された権限、ドメイン固有の自律性、そして進行中の特定のプリンシパルとの関係における法科学的説明責任を備えた非人間のシステムであり、ソフトウェアアシスタントや自律エージェントとは区別される。これは、専門職のリテイナー(常駐・委任)関係や、訓練された作業動物における境界づけられた自律性に着想を得たものである。本技術報告は、ベンチマーク駆動の評価ではなく、システム設計とデプロイメントのケーススタディである。証拠は、単一インスタンスで単一のオペレータを用いたものであり、これらのアーキテクチャ特性が実際に何を支え得るかを示すための例として提示する。Erlang/OTP上の約Gleamで実装した。コード、成果物、機密を伏せた運用ログは、公開時にhttps://github.com/seamus-brady/springdriftで利用可能になる。