oQ、Q、MXFP、UDのMLX量子化のKLD比較

Reddit r/LocalLLaMA / 2026/4/30

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • この記事では、ローカルLLM用途を念頭に、oQ、Q、MXFP、UDの4種類のMLX量子化方式についてKLD(Kullback–Leibler Divergence)ベースで比較した内容を紹介しています。
  • さらに、GitHubリポジトリへのリンクがあり、比較が理論だけでなく計測結果に基づくことを示唆しています。
  • 比較の主眼は、量子化の選択がKLDという指標にどう影響するか(品質と効率のトレードオフ)にあります。
  • 開発者が、より良い性能と効率のバランスを得るために量子化フォーマットを選ぶ際の実用的な参考として位置付けられています。
  • 全体として、この投稿は検証可能な実験データへ読者を導く形のベンチマーク報告です。