AI Navigate

llama.cpp へ Vulkan 用の GATED_DELTA_NET が統合されました

Reddit r/LocalLLaMA / 2026/3/13

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Vulkan 向けの GATED_DELTA_NET が llama.cpp に統合され、最新リリースで PR 20334 経由で利用可能です。
  • Fedora Linux を実行している AMD RX7800XT システムで、この変更により顕著なパフォーマンス向上が得られ、Qwen 3.5 27B のトークン生成速度が約28t/sから約36t/sに向上します。
  • この改善は llama.cpp に統合された Vulkan 用の gated delta-net 実装によるものです。
  • このアップデートは、Llama 系モデルをデプロイしているユーザーの Vulkan ベースの推論ワークロードを向上させ、スループットと効率性の向上をもたらす可能性があります。

https://github.com/ggml-org/llama.cpp/pull/20334
それはすでに最新リリースに含まれているはずです。

私の AMD RX7800XT 設定(Fedora Linux)ではパフォーマンスの向上があります。
Qwen 3.5 27B のトークン生成は約28t/s。
現在は約36t/s です。

投稿者 /u/FancyImagination880
[リンク] [コメント]