https://github.com/ggml-org/llama.cpp/pull/20334
それはすでに最新リリースに含まれているはずです。
私の AMD RX7800XT 設定(Fedora Linux)ではパフォーマンスの向上があります。
Qwen 3.5 27B のトークン生成は約28t/s。
現在は約36t/s です。
[リンク] [コメント]
Reddit r/LocalLLaMA / 2026/3/13
https://github.com/ggml-org/llama.cpp/pull/20334
それはすでに最新リリースに含まれているはずです。
私の AMD RX7800XT 設定(Fedora Linux)ではパフォーマンスの向上があります。
Qwen 3.5 27B のトークン生成は約28t/s。
現在は約36t/s です。
Publickey
Publickey
Dev.to
Dev.to
Dev.to