LLMプランナー：用途・モデル・予算に合う「リグ」を選ぶ、またはリグに合うモデルを選ぶ（60以上の構成、50以上のモデル）

Reddit r/LocalLLaMA / 2026/5/21

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

共有:

要点

LLMRequirementsサイトは、用途・モデル・予算に基づいてLLMモデルと適切なハードウェア「リグ」を選ぶためのガイドを提供し、双方向の2つの主要な使い方を用意しています。
リグとLLMを並べて比較でき、トークン毎秒（t/s）の指標やレビューデータについては出典とYouTubeのレビューリンクを付けることで透明性を高めています。
データには60以上の構成、50以上のモデル、130以上の引用ソースが含まれ、アイドル/アクティブ時の消費電力や複数地域の価格も追跡しつつ、少なくとも週1回更新されています。
さらに、ハードウェア仕様を入力すると、その条件に合うオープンウェイトのモデルを能力別にランキングして提示する「逆引き」モードもあります。
公開GitHubリポジトリへデータをエクスポートし、ベンチマークの追加や不正確さの指摘はissueで行えるようになっています。

要約：インターネット上の情報を、LLMモデル/ハードウェアの選び方ガイドに取り込みました。2つの方向性があります：

さらに、リグとLLMを並べて比較できるモードもあります。トークン/秒（t/s）の数値は出典を引用しています。各ビルドは、実際のレビューユーザーのYouTube動画へリンクしています。

作った理由：何を買うべきか決める必要がありました。5090、spark、それとも strix halo。結果的に、asus が作っている spark にしました。私は、サイトを出て何かをググらなくても済むところまで作り込むつもりでした。

中身として実際に入っているもの：

あらゆる種類の 60+ の具体的なビルド構成（オン/オフのプラグ＆プレイ切り替え、データセンターのオン/オフ切り替え付き）
モデルごとに Q2/Q4/Q5/Q8 での、デコード tok/s + プロンプト処理 tok/s
最初のトークンまでのプロンプト処理時間：100K
アイドル＋アクティブの消費電力（ワット）
使用価格・新品価格（複数リージョン）
ビルド間でリンクされる 150+ のレビューユーザーYouTube動画（レビューを見て判断できるように）
リーダーボード、モデルカード、llama.cpp ベンチスレッド、Tom's Hardware、そしてこのサブにまたがる 130+ の引用ソース
リバースモード：ハードウェアを貼り付ける → 該当するオープンウェイトを表示（チャット/コーディング/エージェント/推論の観点でランキング）。クローズドフロンティアの4つ（Gemini 3.1 Pro、GPT-5.5、Sonnet 4.6、Opus 4.7）も天井の参考として表示
データは少なくとも週1回は更新されます。

やらないこと：