Credit-Budgeted ICPC-Style Coding: When Agents Must Pay for Every Decision

arXiv cs.AI / 4/14/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • 自律型コーディングエージェントの既存評価は無限リソース前提で非現実的だとし、計算時間やテスト実行などのコストを「信用(credit)」で厳密に管理する必要性を示しています。
  • USACOArenaはACM-ICPCスタイルのインタラクティブ・アリーナで、生成トークン、ローカルテスト、経過時間がすべて固定予算から差し引かれることで、精度だけでなくコストと戦略的トレードオフを要求します。
  • プロファイリングの結果、単体の最前線エージェントやスウォームは、制約下で精度とコストを最適に両立できず、行動が経路依存になり得ることが報告されています。
  • USACOArenaは資源制約に強いエージェント・アーキテクチャを育成するための動的トレーニング環境として位置付けられています。

Abstract

Current evaluations of autonomous coding agents assume an unrealistic, infinite-resource environment. However, real-world software engineering is a resource-bound competition. As we scale toward large agent swarms, ignoring compute and time costs risks catastrophic budget exhaustion. To shift the focus from isolated accuracy to cost-aware problem-solving, we introduce USACOArena, an interactive ACM-ICPC-style arena driven by a strict "credit" economy. Every generated token, local test, and elapsed second depletes a fixed budget, forcing agents to make strategic trade-offs. Our comprehensive profiling reveals that frontier single agents and swarms currently fail to optimally balance accuracy with these constraints, exhibiting divergent, path-dependent behaviors. Ultimately, USACOArena provides an essential dynamic training ground for developing highly efficient, resource-aware agent architectures.