訓練とデプロイのギャップを埋める:効率的な量子化対応のためのゲート付きエンコーディングとマルチスケール精緻化
arXiv cs.AI / 2026/4/25
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- モバイルで実際に使用するために量子化すると画質が低下し、訓練とデプロイの間に不一致(ミスマッチ)が生じやすいという課題がある。
- 提案手法はモバイル展開を前提に、階層型ネットワークにゲート付きエンコーダブロックとマルチスケールの精緻化を組み込み、細かな視覚的特徴を保持する。
- 低精度表現の影響を学習中に模擬するQuantization-Aware Training(QAT)を導入し、通常のポストトレーニング量子化(PTQ)で起きがちな品質低下を抑える。
- 実験では、高い画質を維持しつつ、標準的なモバイル端末で実用可能な低計算コストも両立できることを示している。
- 付随するコードは https://github.com/GenAI4E/QATIE.git で公開予定。



