Turbo-DDCM:高速かつ柔軟なゼロショット拡散ベース画像圧縮

arXiv stat.ML / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、Denoising Diffusion Codebook Models(DDCM)を土台にしつつ、最先端の再構成性能と同等の性能を実現する、より高速なゼロショット拡散ベースの画像圧縮手法「Turbo-DDCM」を提案する。

概要: ゼロショットの拡散ベース圧縮手法は近年目覚ましい進展を見せていますが、依然として非常に遅く、計算コストも高いことで知られています。本論文では、既存手法よりも大幅に高速に動作しつつ、性能は最先端の技術と同等の水準を維持する、効率的なゼロショット拡散ベース圧縮手法を提案します。私たちの手法は、近年提案されたDenoising Diffusion Codebook Models(DDCMs)による圧縮方式に基づいています。具体的には、DDCMは、再現可能なランダムなコードブックから拡散ノイズベクトルを順次選択し、デノイザの出力が目的の画像を復元するよう誘導することで画像を圧縮します。私たちは、この枠組みにTurbo-DDCMを導入します。Turbo-DDCMは、各デノイジングステップで多数のノイズベクトルを効率的に組み合わせることで、必要なデノイジング操作の回数を大幅に削減します。この変更は、改善されたエンコーディングプロトコルとも組み合わされています。さらに、Turbo-DDCMには2つの柔軟な派生形を導入します。ユーザが指定した領域を優先する、優先度を考慮したバリアントと、目標BPPではなく目標PSNRに基づいて画像を圧縮する、歪み制御型バリアントです。包括的な実験により、Turbo-DDCMが説得力のある、実用的で、柔軟な画像圧縮方式であることが示されます。