Colinearity Decay:外れ値減衰による量子化に適したViTの学習
arXiv cs.CV / 2026/5/5
📰 ニュースTools & Practical UsageModels & Research
要点
- 本論文は、低ビット幅への量子化で精度が落ちやすい課題(特に活性の外れ値)に焦点を当て、視覚用Transformerの実用的な低ビット展開を目指します。
- 外れ値を単に抑制するのではなく、あるいは事後量子化に頼るのでもなく、Transformerブロック内の行列ペアにおける有害な構造的増幅(アライメント)を制御する正則化として Colinearity-Decay(CD)を提案します。
- CDは非侵襲的に設計されており、モデル構造やタスク損失を変えず、デカップルドな更新として適用することで学習オーバーヘッドも最小限に抑えます。
- ImageNet-1Kでの事前学習、COCOでの検出、下流の微調整にわたる実験で、複数のパイプラインにおいて量子化精度が一貫して改善し、同時にフル精度性能も維持(あるいは向上)することを示します。
- 著者らは、構造的正則化が低ビット展開に向けた“準備”として機能し、推論時の追加コストを伴わないと結論づけています。




