特定のモデルをローカルで動かすのに必要な最小ハードウェアを見積もれるツールや計算機を探しています。
たとえば、Qwen 3.6 27B を現実的にそこそこの速度で動かせる、最も安い構成を知りたいです。理想的には、次のようなことを教えてくれるものが欲しいです。
- 異なる量子化ごとの必要 VRAM
- それが単一GPUで収まるのか、それとも複数GPUが必要か
- 予想トークン/秒(tokens/sec)
- RAM と CPU の推奨
- 消費電力と概算のシステム総コスト
- 中古の 3090 と新しめのカードなど、構成同士の比較
こういうものは存在しますか?
バラバラのベンチマークやRedditの投稿があるのは承知していますが、ローカルのAI構築を計画するときに人々が使う、もう少し体系的なツールやデータベースがあると期待しています。
[link] [comments]




