ARC-AGI-3は、訓練を受けていない人間に匹敵するAIに対して最大200万ドルを提示するが、しかし最前線のモデルはいずれも1%未満にとどまる

THE DECODER / 2026/3/26

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • ARC-AGI-3は、素早く人間が解ける課題を模したインタラクティブなゲーム環境でAIを評価する新しいベンチマークとして紹介されています。
  • 現時点では「フロンティアモデル」でも1%を超えるモデルがなく、最大の強みがベンチマークの条件によって剥がされる設計だと述べられています。
  • 該当ベンチマークで「untrained(未学習の状態に近い)」な人間と同等以上に到達したAIに対し、最高200万ドルの報酬が提示されています。
  • これにより、純粋な汎化能力や学習なしでの推論に焦点を当てた性能評価の重要性が示唆されています。

新しいARC-AGI-3ベンチマークは、AIシステムを人間が難なく解けるインタラクティブなゲーム環境に投入します。ベンチマークが最大の強みをそぎ落としてしまうため、いかなるフロンティアモデルも1%の壁を突破できません。

この記事ARC-AGI-3は、訓練を受けていない人間に匹敵するAIに対して200万ドルを提供するが、それでもすべてのフロンティアモデルは1%未満のスコアは、The Decoderに最初に掲載されました。