AMD NPU上でQwen3.5-4Bを実行する

Reddit r/LocalLLaMA / 2026/3/26

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • Ryzen AI 7 350(XDNA2 NPU)環境で、「Qwen3.5-4B」をLemonade v10.0.1とFastFlowLM v0.9.36を使って動作検証したと報告されています。
  • 省電力で運用でき、画面録画なしで50℃未満に収まったことや、ツール呼び出し(tool-calling)対応が確認されています。
  • 最大256kトークンの言及がありますが、32GB RAMの手元環境では到達できなかったようです。
  • 性能面ではVLMEvalKitスコア85.6%が示され、FastFlowLMがXDNA 2向けNPUsを幅広くサポートしている点が強調されています。
  • ベンチマーク資料や検証用のASUS機種、各プロジェクトのリンク(FastFlowLM、Lemonade server)も共有されています。
Run Qwen3.5-4B on AMD NPU

Ryzen AI 7 350(XDNA2 NPU)32GB RAMで、Lemonade v10.0.1FastFlowLM v0.9.36 を使用して動作確認しました。

機能

  • 低消費電力
  • 画面録画なしで50°Cを大きく下回る
  • ツール呼び出しのサポート
  • 最大256kトークン(この32GBのマシンでは不可)
  • VLMEvalKit のスコア: 85.6%

FLM はすべての XDNA 2 NPUs をサポートしています。

いくつかのリンク:

submitted by /u/BandEnvironmental834
[リンク] [コメント]