Vision-Language Model に導かれた深層アンロールによりパーソナライズされた高速MRIを実現

arXiv cs.CV / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、長時間のMRI撮像時間を削減しつつ診断上の有用性を高めることを目的とした、パーソナライズされた異常対応型の高速MRIフレームワーク「PASS」を提案する。
  • PASSは、物理に基づく深層アンロール再構成ネットワークと、患者固有のk空間軌道を生成するサンプリングモジュールを組み合わせている。
  • 事前学習済みのビジョン・言語モデル(VLM)から抽出した、異常対応型の事前情報を導入し、サンプリングと再構成の両方を臨床的に重要な領域へと導く。
  • 著者らは、異なる解剖部位、コントラスト、異常、加速因子にわたって画像品質が改善することを報告しており、異常検出、局在化、診断といった下流タスクにも有益である。

Abstract

磁気共鳴画像法(MRI)は医療・ヘルスケアにおける中核的技術ですが、取得時間が長いという課題があります。従来の高速化MRI手法は、汎用的な画像品質の最適化にとどまり、特定の臨床タスクへの適応性が欠けています。そこで本研究では、PASS(Personalized, Anomaly-aware Sampling and reconStruction)と呼ぶ、知能的なMRIフレームワークを提案します。PASSは、視覚言語モデル(VLM)を活用し、タスク指向の高速撮像を実現するために深層アンロールネットワークを導きます。PASSは、3つの主要な貢献により撮像パイプラインを動的に個別化します:(1) 磁気共鳴画像(MRI)の物理モデルに基づいて導出した深層アンロール再構成ネットワーク;(2) 患者固有のk空間軌道を生成するサンプリングモジュール;(3) 事前学習済みVLMから抽出した異常を考慮する事前分布であり、サンプリングと再構成の両方を臨床的に関連のある領域へと導きます。VLMの高レベルな臨床的推論を、解釈可能で物理を意識したネットワークと統合することで、PASSは多様な解剖、コントラスト、異常、および加速因子にわたって優れた画像品質を達成します。この改善は、微細な異常検出、局在化、診断を含む下流の診断タスクに対する性能向上として直接的に反映されます。