| モデル: Abiray-Qwen3.6-27B-NVFP4.gguf - Legion 7i Gen10 - NVIDIA GeForce RTX™ 5090 - Intel® Core™ Ultra 9 275HX × 24 - RAM 32.0 GiB llamacpp の設定: 成功したビルドの詳細:
llamacpp のバージョン: b8999 以前の投稿 Qwen3.6-27B-Q6_K で使用したプロンプトもこちらで参照できます: https://www.reddit.com/r/LocalLLaMA/comments/1szp96f/qwen3627bq6_k_images/
SVG を白黒の背景に貼り付けて、最も見た目が良いものを選びました。 結論: - 37 t/s - モデルの創造性の低さが、画像に見て取れます。 - 画像はちょっと子ども向けの漫画っぽい、あるいは Q6_K と比べるとシンプルに見えます(Q6 も業界標準ではなかったですが、私は q6 を好みます)。 [リンク] [コメント] |
Qwen3.6-27B-NVFP4(画像)
Reddit r/LocalLLaMA / 2026/5/2
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research
要点
- この投稿では、AbirayのQwen3.6-27B-NVFP4.ggufを使ってローカル推論環境を成功させた内容が共有されています。
- llama.cppサーバーの起動パラメータと、Legion 7i Gen10(RTX 5090搭載)・Core Ultra 9 275HX・32GB RAMといった環境に加え、NVFP4向けの設定が具体的に示されています。
- llama.cppをCUDA有効・NVFP4有効でビルドする手順が詳細に掲載され、AVX-512/VNNIやCUDA F16、CUDA graphsなどのコンパイルフラグやツールチェーンの版も記載されています。
- ビルド確認として、NVFP4テンソルコア(Blackwell FP4)対応や、GPU/CPUバックエンド(共有ライブラリ群)がコンパイルされ有効化されたことが述べられています。
- 設定したサーバーでSVG画像を生成する例題プロンプトが提示され、この構成での画像生成系の用途が示唆されています。




