信用(クレジット)に基づく予算付きICPCスタイルのコーディング:エージェントが下すすべての判断に対して支払いを要求されるとき
arXiv cs.AI / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 自律型コーディングエージェントの既存評価は無限リソース前提で非現実的だとし、計算時間やテスト実行などのコストを「信用(credit)」で厳密に管理する必要性を示しています。
- USACOArenaはACM-ICPCスタイルのインタラクティブ・アリーナで、生成トークン、ローカルテスト、経過時間がすべて固定予算から差し引かれることで、精度だけでなくコストと戦略的トレードオフを要求します。
- プロファイリングの結果、単体の最前線エージェントやスウォームは、制約下で精度とコストを最適に両立できず、行動が経路依存になり得ることが報告されています。
- USACOArenaは資源制約に強いエージェント・アーキテクチャを育成するための動的トレーニング環境として位置付けられています。

