| 電力とtg/sのトレードオフにおける最適なポイント(スイートスポット)を探しています。 250WはQwen3.6-27Bにとってスイートスポットのようです。 1つの同時リクエストでは、275Wのときにより高いtg/sが出たのは面白いです from tedivm のVLLM-server-config: Benchmark-cmd: [リンク] [コメント] |
2×3090におけるパワーリミットとTG/sの比較
Reddit r/LocalLLaMA / 2026/4/28
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
要点
- Redditの投稿では、2×3090環境でパワーリミットとスループット(tg/s)の最適なトレードオフを探る話がされています。
- 著者は、Qwen3.6-27Bでは250Wが「スイートスポット」に見えると、観測結果にもとづいて述べています。
- また、同時リクエスト数が1の場合は275Wでスループットが伸びたため、パワーとスループットの関係はワークロードの並列度によって変わりうることを示唆しています。
- 投稿には、測定に用いたvLLMの具体的なサーバ設定とベンチマークコマンド(量子化、chunked prefill、prefix caching、speculative設定など)が掲載されています。



