| Raspberry Pi の推論セットアップにさらに作業を進めました。
上記のデモは、以下の特定の量子化を実行しています: https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF/blob/main/Qwen3.5-35B-A3B-UD-Q2_K_XL.gguf 現在期待できる数値(すべて16kコンテキスト、ビジョンエンコーダー有効でのテスト):
皆さんの感想を教えてください。また、Pi 5をお持ちの方で試してみたい、いじってみたいという方がいれば教えてください。私は現在、以下のような他の調整も積極的にテストしています(例えば非対称KVキャッシュの量子化。プロンプト処理のブーストがかなり良い効果をもたらします) [リンク] [コメント] |
Raspberry Pi 5 上の Qwen 3.5 35B A3B の最新情報
Reddit r/LocalLLaMA / 2026/3/12
📰 ニュース
要点
- 元のリポジトリと ik_llama の調整を組み合わせた llama.cpp の修正版ワークフローとプロンプトキャッシュを使用して、Raspberry Pi 5 上で Qwen 3.5 35B A3B を実行するデモを著者が実演しています。