LLMプランナー:用途・モデル・予算に合う「リグ」を選ぶ、またはリグに合うモデルを選ぶ(60以上の構成、50以上のモデル)

Reddit r/LocalLLaMA / 2026/5/21

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • LLMRequirementsサイトは、用途・モデル・予算に基づいてLLMモデルと適切なハードウェア「リグ」を選ぶためのガイドを提供し、双方向の2つの主要な使い方を用意しています。
  • リグとLLMを並べて比較でき、トークン毎秒(t/s)の指標やレビューデータについては出典とYouTubeのレビューリンクを付けることで透明性を高めています。
  • データには60以上の構成、50以上のモデル、130以上の引用ソースが含まれ、アイドル/アクティブ時の消費電力や複数地域の価格も追跡しつつ、少なくとも週1回更新されています。
  • さらに、ハードウェア仕様を入力すると、その条件に合うオープンウェイトのモデルを能力別にランキングして提示する「逆引き」モードもあります。
  • 公開GitHubリポジトリへデータをエクスポートし、ベンチマークの追加や不正確さの指摘はissueで行えるようになっています。
LLM planner - 使用ケース/モデル/予算に合わせて構成(リグ)を選ぶ、またはリグに合うモデルを選ぶ。60+ 件の構成、50+ モデル、130+ 件の引用 t/s ソース、150+ 件のレビューユーザーYouTube動画、アイドル+アクティブのワット数、複数リージョンの価格、定期的なアップデート。

要約:インターネット上の情報を、LLMモデル/ハードウェアの選び方ガイドに取り込みました。2つの方向性があります:

  • 「使用ケース/モデル/予算に対して、どんなリグを買うべき?」
  • 「3090 / M3 Max / DGX Spark / Strix Halo / R9700 を持っています。それで何がうまく動きますか?」

さらに、リグとLLMを並べて比較できるモードもあります。トークン/秒(t/s)の数値は出典を引用しています。各ビルドは、実際のレビューユーザーのYouTube動画へリンクしています。

作った理由:何を買うべきか決める必要がありました。5090、spark、それとも strix halo。結果的に、asus が作っている spark にしました。私は、サイトを出て何かをググらなくても済むところまで作り込むつもりでした。

中身として実際に入っているもの:

  • あらゆる種類の 60+ の具体的なビルド構成(オン/オフのプラグ&プレイ切り替え、データセンターのオン/オフ切り替え付き)
  • モデルごとに Q2/Q4/Q5/Q8 での、デコード tok/s + プロンプト処理 tok/s
  • 最初のトークンまでのプロンプト処理時間:100K
  • アイドル+アクティブの消費電力(ワット)
  • 使用価格・新品価格(複数リージョン)
  • ビルド間でリンクされる 150+ のレビューユーザーYouTube動画(レビューを見て判断できるように)
  • リーダーボード、モデルカード、llama.cpp ベンチスレッド、Tom's Hardware、そしてこのサブにまたがる 130+ の引用ソース
  • リバースモード:ハードウェアを貼り付ける → 該当するオープンウェイトを表示(チャット/コーディング/エージェント/推論の観点でランキング)。クローズドフロンティアの4つ(Gemini 3.1 Pro、GPT-5.5、Sonnet 4.6、Opus 4.7)も天井の参考として表示
  • データは少なくとも週1回は更新されます。

やらないこと:

  • あなたの地域で最安値の価格へのリンクを提示すること。
  • そのハードウェアで「最終的に到達できる」絶対的に最高の tps を提示すること。量子化/ソフトウェア、パッチ、アップデートによって結果は変わります(個体差あり)。

リンク:https://llmrequirements.com

すべてのデータは公開リポジトリにエクスポートされています
https://github.com/Trenin-Labs/LlmRequirements
公開リポジトリのこのデータについて、ベンチマークや不正確さの報告を github の issue で行うためのリンクがウェブサイト上にあります。

投稿者: /u/totosse17
[リンク] [コメント]