広告

単一の500ドルGPU上で動くオープンソースAIシステムが、コーディングベンチマークでClaude Sonnetを上回る

Reddit r/artificial / 2026/3/25

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 「ATLAS」と呼ばれるオープンソースのAIシステムが、単一の500ドルの一般向けGPU上で動作する14Bパラメータモデルによって、LiveCodeBenchのコーディングベンチマークでClaude Sonnet 4.5を上回ると報じられている(74.6% vs 71.4%、599問)。
  • 改善は、モデル規模の拡大というよりも、複数の解決アプローチを生成し、それらをテストして最良の出力を選択するマルチステップのパイプラインによるものだとされている。
  • この記事では、このシステムはクラウドサービスを不要とし、APIコストも発生せず、ファインチューニングも不要だとしており、ローカルでの実験に取り組みやすいとしている。
  • 報告されている運用コストは非常に低く、タスクあたりの電気代は約0.004ドルと見積もられている。一般向けのハードウェアに「スマートなインフラストラクチャ」を組み合わせることで、より高いコーディング性能へつながる現実的な道筋を示している。
  • プロジェクトのGitHubリポジトリが提供されており、他の人々がこのアプローチを再現し、インフラ層での成果をさらに発展させられるようになっている。

ますます多くのデータセンターを建てることだけが選択肢ではなかったらどうでしょう? スマートなシステムによって、消費者レベルでトップモデルと同等の性能レベルを引き出せるのであれば、世界が「AIはずっと安く、しかもずっと手に入れやすいものだ」という認識に至るまで、時間の問題です。

ATLAS のようなオープンソースプロジェクトは、この可能性の最前線にあります。そこでは、バージニア工科大学の22歳の大学生が、たった1台の500ドルのコンシューマGPUで、パラメータ14BのAIモデルを構築して実行し、コーディングベンチマークでClaude Sonnet 4.5を上回るスコアを出しました(LiveCodeBenchで74.6% vs 71.4%、599問)。

クラウドなし、APIコストなし、ファインチューニングなし。小さなモデルの周囲にスマートなインフラを用意するだけで、使うのはコンシューマ向けのグラフィックスカードです。

そしてコストは? 電気代として、1タスクあたり約0.004ドルです。

ATLASで使われているベースモデルは、スコアがおよそ55%にとどまります。パイプラインは、複数の解決アプローチを生成し、それらをテストして最良のものを選ぶことで、ほぼ20パーセントポイント上乗せします。より賢いインフラとシステム設計が、業界の未来であることを証明しています。

Repo: https://github.com/itigges22/ATLAS

投稿者 /u/Additional_Wish_3619
[link] [comments]

広告