AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

Qwen3.6-27B-3bit-mlx（Hugging Face）：RAMの少ないMacユーザー向けに3bit/5bitの混合量子化

Reddit r/LocalLLaMA / 2026/4/27

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

原文を読む →

共有:

要点

Hugging Faceに、Mac向けの「Qwen3.6-27B」の3bit混合量子化モデル（埋め込み層と予測層は5bit）への言及があります。
以前はUnsloth由来の3bit版が1つしかなく、重くて動作が非常に遅かった一方で、今回のモデルは同等品質を保ちつつ2倍速いとされています。
投稿者はLM Studioでのエージェント的なテスト結果として、性能面でも「同等に良い」と評価しています。
さらに、LM StudioのJinjaテンプレートで「preserve_thinking」を有効化する設定例（{%- set preserve_thinking = true %}）が示されています。

Qwen3.6-27B-3bit-mlx · Hugging Face: 3 & 5 mixed quant for RAM poor Mac users.

Macユーザー向けに、3bitの混合量子化（埋め込みと予測レイヤーは5bit）を出しました。

このモデルの3bit版はこれまで1つしかありませんでした（Unsloth製）が、とても重くて、つらいほど遅かったです：

https://huggingface.co/models?other=base_model:quantized:Qwen%2FQwen3.6-27B&sort=trending&search=3-bit

これはその2倍速く、私自身のエージェントによるテストでも同等に良い結果でした。LM Studioで、jinjaテンプレートのpreserve thinkingを次のように有効にしてください：

{%- set preserve_thinking = true %}

投稿者 /u/JLeonsarmiento
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

.NETにおけるコンテキスト圧縮

.NETにおけるコンテキスト圧縮

Dev.to

サブエージェント：エージェント型AIのビルディングブロック

サブエージェント：エージェント型AIのビルディングブロック

Dev.to

Canva、AIツールがデザイン内の「Palestine」を別の語に置き換えたことを謝罪

Canva、AIツールがデザイン内の「Palestine」を別の語に置き換えたことを謝罪

The Verge

CursorがMD5パスワードハッシュを書き続ける理由（CWE-328）

CursorがMD5パスワードハッシュを書き続ける理由（CWE-328）

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告