訓練とデプロイのギャップを埋める:効率的な量子化対応のためのゲート付きエンコーディングとマルチスケール精緻化

arXiv cs.AI / 2026/4/25

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • モバイルで実際に使用するために量子化すると画質が低下し、訓練とデプロイの間に不一致(ミスマッチ)が生じやすいという課題がある。
  • 提案手法はモバイル展開を前提に、階層型ネットワークにゲート付きエンコーダブロックとマルチスケールの精緻化を組み込み、細かな視覚的特徴を保持する。
  • 低精度表現の影響を学習中に模擬するQuantization-Aware Training(QAT)を導入し、通常のポストトレーニング量子化(PTQ)で起きがちな品質低下を抑える。
  • 実験では、高い画質を維持しつつ、標準的なモバイル端末で実用可能な低計算コストも両立できることを示している。
  • 付随するコードは https://github.com/GenAI4E/QATIE.git で公開予定。

Abstract

モバイルデバイス向けの画像強化モデルは、高い出力品質と、モバイル機器に求められる高速な処理速度との両立に苦慮することが多いです。近年の深層学習モデルによって、低品質なモバイル写真を高品質な画像へ強化できるようになってきましたが、実際のモバイル端末で使用するために低精度の形式へ変換すると、その性能はしばしば劣化します。この学習とデプロイメントの不整合に対処するため、私たちはモバイルへの実装に特化した効率的な画像強化モデルを提案します。提案手法では、階層的なネットワーク構成として、ゲート付きエンコーダブロックとマルチスケールのリファインメントを用い、微細な視覚的特徴を保持します。さらに、Quantization-Aware Training(QAT)を取り入れ、学習プロセス中に低精度表現の影響をシミュレートします。これにより、ネットワークが適応できるようになり、通常の事後量子化(PTQ)で見られる典型的な品質低下を防止します。実験結果は、提案手法が高忠実度な視覚出力を生成しつつ、標準的なモバイルデバイスでの実用に必要な低い計算オーバーヘッドを維持することを示しています。コードは https://github.com/GenAI4E/QATIE.git で公開予定です。

訓練とデプロイのギャップを埋める:効率的な量子化対応のためのゲート付きエンコーディングとマルチスケール精緻化 | AI Navigate