ubergarm/Kimi-K2.6-GGUF Q4_X が利用可能に

Reddit r/LocalLLaMA / 2026/4/21

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

ubergarm/Kimi-K2.6 GGUF Q4_Xモデルが公開され、「フルサイズ」のKimi-K2.6 Q4_Xをパッチ/量子化するためのコミュニティの手順が共有された。
このQ4_Xは ik と mainline の両方の llama.cpp で動作するとされるが、必要なメモリ/VRAMは非常に大きく（およそ584GB以上）、大規模環境向けの内容になっている。
著者は imatrix を用いたカスタム量子化の追加フォローや、ik_llama.cpp上で動かせるより小型の量子化版も予定している。
さらに AesSedai が mainline 向けの MoE 最適化レシピを近日中に提供する可能性があるとしており、GLM-5.1との比較にも関心が示されている。

ubergarm/Kimi-K2.6-GGUF Q4_X now available

今日は jukofyork と AesSedai に感謝です。「フルサイズ」の Kimi-K2.6「Q4_X」をパッチして量子化するためのヒントをいくつかもらいました。ik と mainline llama.cpp の両方で動きます（必要なメモリが RAM+VRAM で約 ~584GB 以上ある場合...）

カスタムの量子化を作っている他の人のために、imatrix で続報します。さらに、ik_llama.cpp で動く小さめの量子化版も近々出します。AesSedai は mainline MoE 用の最適化レシピも近いうちに用意する可能性が高いです！

乾杯！そして、この大きい方が GLM-5.1 と比べてどうなるか気になります。

投稿者 /u/VoidAlchemy
[link] [comments]

Black Hat USA

AI Business

ブラックハット・アジア

AI Business

ウェイモ、トヨタと自家用車にロボタク技術幹部「E2Eは追加機能いる」

日経XTECH

Adobe、MCPをエンタープライズ調達の“費目”に格上げ

Dev.to

因果的説明可能強化学習による精密腫瘍学の臨床ワークフロー：ハイブリッド量子-古典パイプライン

Dev.to

ubergarm/Kimi-K2.6-GGUF Q4_X が利用可能に

要点

関連記事

Black Hat USA

ブラックハット・アジア

ウェイモ、トヨタと自家用車にロボタク技術幹部「E2Eは追加機能いる」

Adobe、MCPをエンタープライズ調達の“費目”に格上げ

因果的説明可能強化学習による精密腫瘍学の臨床ワークフロー：ハイブリッド量子-古典パイプライン

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat USA

ブラックハット・アジア

ウェイモ、トヨタと自家用車にロボタク技術 幹部「E2Eは追加機能いる」

Adobe、MCPをエンタープライズ調達の“費目”に格上げ

因果的説明可能強化学習による精密腫瘍学の臨床ワークフロー：ハイブリッド量子-古典パイプライン

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ウェイモ、トヨタと自家用車にロボタク技術幹部「E2Eは追加機能いる」