エージェンティックAIシステムは「限界トークン配分」として設計すべき

arXiv cs.AI / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、エージェンティックAIシステムを、単なる「単位あたりのテキスト生成」としてではなく「限界トークン配分の経済」として設計・評価すべきだと提案している。
失敗したテストを直すコーディングエージェントへの1つの依頼を、モデルのルーティング、計画・行動・検証・延期の自律判断、トークン生成の提供（サービング）、学習で追跡ログを学習に回すかの選択という4つの層に沿って追い、いずれも同じ基礎的条件（限界便益＝限界コスト＋レイテンシコスト＋リスクコスト）を最適化していると論じる。
「共通の会計対象」を限界トークン配分に置くことで、局所的にトークン数を最小化してもシステム全体ではトークンが誤配分されうる理由を説明できるとする。
同フレームワークは、過剰ルーティング、過剰委任、過少検証、サービングの輻輳、古いロールアウト、キャッシュの誤用といった再発しやすい失敗モードを予測する。
トークンを意識した評価、自律性の価格付け、輻輳に応じたサービング、リスク調整した強化学習（RL）予算といった具体的な研究課題を提示している。