https://arcprize.org/arc-agi/3
興味深いですね。彼らは推論の痕跡を調べることで、うまく動作しているモデルはいずれも、トレーニングセット内にARCに似たデータが含まれている可能性が高いことを見つけているようです。
また、ラウンド3のすべての最先端モデルのスコアは1%未満です。改善の余地は大いにあります。特に、ラウンド1-2の賞がまだ受け取られていないことを考えると(効率性がまだ不足しています)。
[リンク] [コメント]
Reddit r/MachineLearning / 2026/3/26
https://arcprize.org/arc-agi/3
興味深いですね。彼らは推論の痕跡を調べることで、うまく動作しているモデルはいずれも、トレーニングセット内にARCに似たデータが含まれている可能性が高いことを見つけているようです。
また、ラウンド3のすべての最先端モデルのスコアは1%未満です。改善の余地は大いにあります。特に、ラウンド1-2の賞がまだ受け取られていないことを考えると(効率性がまだ不足しています)。