Qwen3.6 + ik_llama はめちゃ速いらしい

Reddit r/LocalLLaMA / 2026/4/20

💬 オピニオンSignals & Early TrendsTools & Practical Usage

要点

  • この投稿では、Qwen3.6(UD_Q_4_K_M)を16GB VRAMと32GB RAMのマシンでローカル実行していると報告しています。
  • 200kコンテキスト(200k cw)で、50トークン/秒以上のスループットが出たと主張しています。
  • Redditユーザーによるローカル実行の実測ベンチマークとして、特に「速さ」を強調しています。
  • 新しいモデルのリリースや公式発表ではなく、性能結果に焦点を当てた内容です。
QWEN3.6 + ik_llama is fast af

16GBのVRAMと32GBのRAMで、200k cw @50+ tok/s の条件にてqwen3.6 UD_Q_4_K_Mを動かしています

投稿者 /u/_BigBackClock
[link] [comments]