エージェンティックAIシステムは「限界トークン配分」として設計すべき

arXiv cs.AI / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、エージェンティックAIシステムを、単なる「単位あたりのテキスト生成」としてではなく「限界トークン配分の経済」として設計・評価すべきだと提案している。
  • 失敗したテストを直すコーディングエージェントへの1つの依頼を、モデルのルーティング、計画・行動・検証・延期の自律判断、トークン生成の提供(サービング)、学習で追跡ログを学習に回すかの選択という4つの層に沿って追い、いずれも同じ基礎的条件(限界便益=限界コスト+レイテンシコスト+リスクコスト)を最適化していると論じる。
  • 「共通の会計対象」を限界トークン配分に置くことで、局所的にトークン数を最小化してもシステム全体ではトークンが誤配分されうる理由を説明できるとする。
  • 同フレームワークは、過剰ルーティング、過剰委任、過少検証、サービングの輻輳、古いロールアウト、キャッシュの誤用といった再発しやすい失敗モードを予測する。
  • トークンを意識した評価、自律性の価格付け、輻輳に応じたサービング、リスク調整した強化学習(RL)予算といった具体的な研究課題を提示している。