WFM：超高速マルチモーダルMRI合成のための3Dウェーブレット・フローマッチング

arXiv cs.CV / 2026/4/24

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

共有:

要点

この論文は、拡散モデルによるMRI合成が非効率なのは、純粋なノイズから開始し、既存のMRIシーケンスに含まれる構造情報を捨ててしまうためだと主張している。
提案手法WFM（Wavelet Flow Matching）は、条件付きモダリティの平均をウェーブレット空間で計算した「情報を持つ事前分布」から目的分布へ直接フローを学習し、合成を1〜2ステップで可能にする。
ブラッツ（BraTS）の4つのMRIモダリティ（T1、T1c、T2、FLAIR）について、82Mパラメータの単一モデル（クラス条件付き）で合成を行い、4つの別々の拡散モデル（計326Mパラメータ）を置き換える。
BraTS 2024でWFMは26.8 dB PSNRと0.94 SSIMを報告し、拡散ベースラインに対して1〜2 dB以内の品質を維持しつつ、250〜1000倍高速（0.16〜0.64秒 vs 160秒/ボリューム）を実現した。
著者らはコードも公開しており、示された速度と品質の両立により、臨床ワークフローでのリアルタイムMRI合成が現実的になる可能性を示している。

要旨: 拡散モデルは多モーダルMRI合成において目覚ましい品質を達成してきましたが、その計算コスト（数百のサンプリングステップとモダリティごとに別個のモデル）は臨床導入の障壁になっています。私たちは、この非効率性が「不要な出発点」に起因していることを観察します。すなわち拡散は純粋なノイズから開始し、利用可能なMRI系列にすでに含まれている構造情報を捨ててしまうのです。そこで、WFM（Wavelet Flow Matching）を提案します。WFMは、拡散の開始点を固定するのではなく、ウェーブレット空間における条件モダリティの平均という、情報を含んだ事前分布から目標分布へ向けた「直接のフロー」を学習します。出発元と目標の間には基盤となる解剖（アナトミー）が共有され、主にコントラストのみが異なるため、この定式化により、正確な合成がわずか1〜2回の積分ステップで可能になります。クラス条件付けを備えた82Mパラメータの単一モデルで、4つのBraTSモダリティ（T1、T1c、T2、FLAIR）すべてを合成できます。これは、合計326Mパラメータに相当する4つの別個の拡散モデルを置き換えるものです。BraTS 2024において、WFMは26.8 dBのPSNRと0.94のSSIMを達成し、拡散ベースラインとの差は1〜2 dB以内です。一方で、1ボリュームあたりの推論時間は250〜1000倍高速で（0.16〜0.64秒 vs 160秒）、速度と品質のトレードオフにより、MRI合成のリアルタイム化が臨床ワークフローで現実的になります。コードは https://github.com/yalcintur/WFM で公開されています。