WFM:超高速マルチモーダルMRI合成のための3Dウェーブレット・フローマッチング

arXiv cs.CV / 2026/4/24

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • この論文は、拡散モデルによるMRI合成が非効率なのは、純粋なノイズから開始し、既存のMRIシーケンスに含まれる構造情報を捨ててしまうためだと主張している。
  • 提案手法WFM(Wavelet Flow Matching)は、条件付きモダリティの平均をウェーブレット空間で計算した「情報を持つ事前分布」から目的分布へ直接フローを学習し、合成を1〜2ステップで可能にする。
  • ブラッツ(BraTS)の4つのMRIモダリティ(T1、T1c、T2、FLAIR)について、82Mパラメータの単一モデル(クラス条件付き)で合成を行い、4つの別々の拡散モデル(計326Mパラメータ)を置き換える。
  • BraTS 2024でWFMは26.8 dB PSNRと0.94 SSIMを報告し、拡散ベースラインに対して1〜2 dB以内の品質を維持しつつ、250〜1000倍高速(0.16〜0.64秒 vs 160秒/ボリューム)を実現した。
  • 著者らはコードも公開しており、示された速度と品質の両立により、臨床ワークフローでのリアルタイムMRI合成が現実的になる可能性を示している。

要旨: 拡散モデルは多モーダルMRI合成において目覚ましい品質を達成してきましたが、その計算コスト(数百のサンプリングステップとモダリティごとに別個のモデル)は臨床導入の障壁になっています。私たちは、この非効率性が「不要な出発点」に起因していることを観察します。すなわち拡散は純粋なノイズから開始し、利用可能なMRI系列にすでに含まれている構造情報を捨ててしまうのです。そこで、WFM(Wavelet Flow Matching)を提案します。WFMは、拡散の開始点を固定するのではなく、ウェーブレット空間における条件モダリティの平均という、情報を含んだ事前分布から目標分布へ向けた「直接のフロー」を学習します。出発元と目標の間には基盤となる解剖(アナトミー)が共有され、主にコントラストのみが異なるため、この定式化により、正確な合成がわずか1〜2回の積分ステップで可能になります。クラス条件付けを備えた82Mパラメータの単一モデルで、4つのBraTSモダリティ(T1、T1c、T2、FLAIR)すべてを合成できます。これは、合計326Mパラメータに相当する4つの別個の拡散モデルを置き換えるものです。BraTS 2024において、WFMは26.8 dBのPSNRと0.94のSSIMを達成し、拡散ベースラインとの差は1〜2 dB以内です。一方で、1ボリュームあたりの推論時間は250〜1000倍高速で(0.16〜0.64秒 vs 160秒)、速度と品質のトレードオフにより、MRI合成のリアルタイム化が臨床ワークフローで現実的になります。コードは https://github.com/yalcintur/WFM で公開されています。