ドメイン固有の潜在表現が、拡散ベースの医用画像超解像の忠実度を改善する

arXiv cs.CV / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

この研究では、拡散ベースの医用画像超解像において、再構成の忠実度を最も強く制約するのは拡散アーキテクチャではなく、基盤となるVAE/潜在オートエンコーダの選択であることがわかった。
汎用のStable Diffusion VAEを、1.6M+の医用画像で事前学習されたドメイン固有オートエンコーダであるMedVAEに置き換えることで、膝MRI、脳MRI、胸部X線における再構成が約+2.91〜+3.29 dBのPSNR向上を示した。
ウェーブレット解析により、この改善は解剖学的に重要な微細構造を符号化する最も細かな空間周波数帯域に集中していることが示された。
アブレーション（推論スケジュール、予測ターゲット、生成アーキテクチャ）を通じても、忠実度のギャップは安定しており（~±0.15 dB）、一方でハルシネーション率は同程度である。これにより、再構成と生成アーティファクトを独立に制御できることが示唆される。
著者らは実用的な選択基準を提案している。すなわち、ドメイン固有オートエンコーダの再構成品質（拡散トレーニングなしで測定）を指標とすると、下流のSR性能を予測でき（R² = 0.67）、GitHubでコードと学習済み重みを公開している。