CoQuant:混合精度LLMに対する重み・活性の共同サブスペース射影

arXiv cs.LG / 2026/4/30

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文では、CoQuantというPTQ手法を提案し、活性統計だけに頼るのではなく、重みと活性の量子化ノイズを同時に考慮することで混合精度LLMの推論コスト削減を目指します。
  • CoQuantは、期待出力誤差を理論的にモデル化することで、重み付きPCAによる閉形式の解を導出し、最適な高精度サブスペースを選択します。
  • Llama-3.2およびQwen2.5での実験では、WikiTextのperplexityとゼロショットの常識推論精度の両方で、強力なPTQベースラインに対して一貫した改善が示されています。
  • 実装可能なコードも公開されており、重み・活性の共同サブスペースモデリングを低ビットLLM量子化へ適用するための検証・導入が進めやすくなっています。