CardioDiT: 4D心臓MRI合成のための潜在拡散トランスフォーマ
arXiv cs.CV / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- CardioDiTは、心臓のシネMRIを統一された4D(空間+時間)の潜在拡散問題として合成することを提案し、空間と時間を分解して扱う従来手法や、マスクのような時間的一貫性トリックに依存する手法の限界に対処します。
- この手法では、時空間VQ-VAEを用いて2D+tスライスをコンパクトな潜在表現へエンコードし、その後、拡散トランスフォーマが得られた潜在表現をフルの3D+tボリュームとして共同でモデル化することで、空間生成と時間生成をエンドツーエンドで結び付けます。
- 公開データセットおよびより大規模なプライベートコホートでの実験により、スライス間の整合性、心臓運動の時間的な整合性、心機能の分布の現実性が向上することが示されています。
- 著者らは、時空間の結合度を段階的に高めたベースラインとCardioDiTを比較し、拡散トランスフォーマによる明示的な4Dモデリングが4D心臓画像合成のより原理的な基盤となることを主張します。
- 公開データで学習したコードおよびモデルは、提供されたGitHubリポジトリを通じて公開され、再現性の支援とさらなる研究を可能にします。



