リヴィザブル・バイ・デザイン:ストリーミングLLMエージェント実行の理論

arXiv cs.LG / 2026/4/28

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • この論文は、多くのLLMエージェントが実行を単一のトランザクションのように扱うため、ユーザーが回答を待つか途中で中断して進捗を失うかという二択を迫られていると主張します。
  • エージェントの作業とユーザー介入を双方向チャネル上で並行・相互に組み合わせて行う「ストリーム」実行パラダイムを提案し、実行中の途中修正を対話の第一級の形にします。
  • 著者らは可逆性タクソノミー(恒等的・可逆・補償的・不可逆)を導入し、実行中にどれだけ柔軟に適応できるかは、アクションの可逆性特性によって本質的に制約されることを示します。
  • 補償的アクションが競合すると適応コストが不可避になる一方、不可逆アクションが競合すると要求仕様の完全な充足が不可能になり得ることを証明します。
  • 「Revision Absorber」アルゴリズムを提示し、StreamBenchでの実験により、全面やり直しに近い品質を保ちつつ、完了済み作業の再利用によって無駄にするステップを約1桁(桁違い)減らせることを検証します。

要旨: 現在のLLMエージェントは、暗黙かつ普遍的な前提のもとで動作しています。それは「実行はトランザクションである」という仮定です――ユーザーが要求を送信し、エージェントは隔離された状態で作業し、完了した時点でのみ対話が再開します。これによりユーザーは二者択一を迫られます。すなわち、誤りの可能性がある出力を待つか、途中で中断してすべての進捗を失うかです。我々はこの前提を退け、ストリーム・パラダイムを提案します。このパラダイムでは、エージェントの実行とユーザーの介入が同時並行のプロセスとして扱われ、双方向のチャネルを共有しつつ、相互にインターリーブされます。我々は、このパラダイムを「可逆性(reversibility)」の分類体系によって形式化し、すべてのエージェントの行動を Idempotent(冪等的)、Reversible(可逆的)、Compensable(補償可能的)、Irreversible(不可逆的)のいずれかに分類します。そして到達した中核的な結論は次の通りです。エージェントの柔軟性は、その可逆性によって上限が定まる、ということです。補償可能な行動どうしの衝突が課す避けられない適応コストを証明し、また不可逆的な行動どうしの衝突が完全な仕様充足を不可能にすることを示します。これらのコストはアルゴリズムではなく、行動空間の性質です。この洞察に導かれ、Earliest-Conflict Rollback(最初の衝突時ロールバック)則に基づく反応的アルゴリズム「Revision Absorber(修正吸収器)」を提示します。これは、穏やかな仮定のもとで構造的に最適です。実在のLLMエージェントを用いた StreamBench による実験により、すべての予測が検証されました。Absorber は、総当たりのフル再起動ベースラインと同等の品質を達成しつつ、すでに完了していた作業について費やすステップ数を桁違いに少なくします。これにより、実行途中での修正を「行き止まり」から「第一級のインタラクション」へと変えます。