適応的ブロックスケールデータ型
arXiv cs.CL / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、NVFP4 の4ビット量子化の重要な制約として、誤差分布が各16値ブロック内の最大値付近で極端に大きな量子化誤差を生み得る点を指摘している。
- そこで、Adaptive Block-Scaled Data Types(適応的ブロックスケールデータ型)を提案し、特に IF4 を導入する。これは、16値グループごとに FP4 と INT4 のどちらを用いるかを選択し、E4M3 のスケール係数(符号ビットでエンコード)を用いることで入力分布により適合させる。
- 著者らは、この適応的な発想を他のビット幅にも拡張しており、IF3 や IF6 を含め、固定フォーマット方式を超えて量子化挙動の改善を狙っている。
- 言語モデルに対する実験では、IF4 は量子化学習中の損失を低減し、既存の4ビット・ブロックスケール形式と比べてポストトレーニング量子化の精度を向上させることが示されている。
- 実デプロイを見据えるため、本研究では IF4 の Multiply-Accumulate(MAC)ユニットを設計・評価し、引用された GitHub リポジトリを通じてコードも提供している。これにより、ハードウェアアクセラレータで効率的に実装できることを示唆している。



