ATLAS-RTC: トークンレベルの実行時制御でLLMエージェント出力のループを閉じる

arXiv cs.LG / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

ATLAS-RTCは、自己回帰型LLMのための実行時制御システムとして導入されており、トークンごとのデコード中に構造化された出力を強制します。
この手法は、事前に定義された出力契約からの逸脱（ドリフト）を検出するための軽量なモニタリング信号を用い、その後バイアス付け、マスキング、ロールバックといった介入をクローズドループ内で適用します。
後処理の検証や静的な制約付きデコードと比べて、ATLAS-RTCはエラーが完全に顕在化する前に生成を修正することで、エラーの発生を防ぐことを目指します。
構造化生成およびツール呼び出しタスクに関する実験では、初回試行の成功率が大きく向上（20〜37.8パーセンテージポイント）し、失敗が多い状況では遅延が大幅に減少（最大88%）します。
著者らは、観測された失敗の多くがタスクの真の理解不足ではなくデコードのアーティファクトに起因するものであると主張しており、信頼性の高いLLMシステムにとって実行時制御を別個で重要な層として位置付けています。

要旨: 隠れ状態（自己回帰）言語モデルのためのランタイム制御システムであるATLAS-RTCを提案します。これはデコード中に構造化された出力を強制するものです。ATLAS-RTCは各ステップで生成を監視し、軽量なシグナルを用いて出力コントラクトからの逸脱を検出し、バイアス付け、マスキング、ロールバックといった狙いを定めた介入を適用します。事後的な検証や静的な制約付きデコードとは異なり、本システムはクローズドループで動作し、誤りが顕在化する前に修正を可能にします。構造化生成およびツール呼び出しのタスクにわたって、ATLAS-RTCは初回試行の成功率を20〜37.8パーセンテージポイント改善し、失敗が支配的な設定では最大88%のレイテンシ削減を実現します。結果は、多くの失敗がタスクの理解不足というよりもデコード上のアーティファクトに起因することを示しており、LLMシステムにおける独立した層としてのランタイム制御を動機づけます。