ARC-AGI-3 offers $2M to any AI that matches untrained humans, yet every frontier model scores below 1%

THE DECODER / 3/26/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • ARC-AGI-3は、素早く人間が解ける課題を模したインタラクティブなゲーム環境でAIを評価する新しいベンチマークとして紹介されています。
  • 現時点では「フロンティアモデル」でも1%を超えるモデルがなく、最大の強みがベンチマークの条件によって剥がされる設計だと述べられています。
  • 該当ベンチマークで「untrained(未学習の状態に近い)」な人間と同等以上に到達したAIに対し、最高200万ドルの報酬が提示されています。
  • これにより、純粋な汎化能力や学習なしでの推論に焦点を当てた性能評価の重要性が示唆されています。

The new ARC-AGI-3 benchmark drops AI systems into interactive game environments that humans solve with ease. No frontier model breaks the 1 percent mark because the benchmark strips away their biggest advantages.

The article ARC-AGI-3 offers $2M to any AI that matches untrained humans, yet every frontier model scores below 1% appeared first on The Decoder.