MosaicMRI: 多様なデータセットと、生の筋骨格MRIのためのベンチマーク

arXiv stat.ML / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • MosaicMRIは、筋骨格系(MSK)領域の完全サンプリング生MRI測定データセットで、2,671ボリューム/80,156スライスを含む大規模・多様性重視の公開ベンチマークとして提示されました。
  • データは撮像断面(軸位・矢状位など)、コントラスト(PD/T1/T2)、対象解剖(脊椎・膝・股関節・足首など)、使用コイル数などが幅広く、従来の脳や膝中心データ偏重による評価の限界を補うことを狙っています。
  • VarNetを加速再構成のベースラインに用いて、モデル容量とデータサイズの両面からスケーリング特性を体系的に検証し、低サンプル条件では複数解剖を混ぜて学習したモデルが解剖特化より優れる傾向を示しました。
  • 解剖をまたいだ汎化(例:脊椎で学習して膝で評価)も評価し、足と肘など相互に良好に一般化する身体部位グループや、ドメインシフト下の性能が学習データ規模・解剖・プロトコル要因の組み合わせに依存する点を明らかにしています。

Abstract

深層学習は、再構成、アーチファクト除去、セグメンテーションなど、MRIの幅広い応用を支えています。しかし、これまでの進展は主に、脳や膝の画像に焦点を当てた公開データセットによって牽引されてきました。その結果、モデルの学習や評価のあり方が形作られています。したがって、多様な解剖学的状況におけるこれらのモデルの信頼性について、注意深い検証は依然として限られています。本研究では、機械学習ベースの手法のトレーニングおよび評価のために設計された、大規模かつ多様な、完全サンプリング済みの生(raw)筋骨格(MSK)MR計測のコレクションであるMosaicMRIを提案します。MosaicMRIは、これまでで最大のオープンソースの生MSK MRIデータセットであり、2,671ボリュームと80,156枚のスライスで構成されています。本データセットは、ボリュームの向き(例:軸位、矢状位)、画像コントラスト(例:PD、T1、T2)、解剖(例:脊椎、膝、股関節、足首、その他)、および撮像コイル数において大きな多様性を提供します。加速再構成課題のベースラインとしてVarNetを用い、モデルの容量とデータセットサイズの両方に関するスケーリング挙動を調べるための包括的な一連の実験を行います。興味深いことに、複数の解剖を統合して学習したモデルは、低サンプル領域において解剖特化型モデルを大きく上回り、解剖学的多様性の利点と、活用可能な解剖間相関の存在が示されます。さらに、ある解剖(例:脊椎)で学習し、別の解剖(例:膝)でテストすることにより、頑健性および解剖間の汎化を評価します。特筆すべき点として、互いによく汎化する身体部位のグループ(例:足部と肘部)を特定し、ドメインシフト下での性能は、学習セットサイズだけでなく、解剖、およびプロトコル固有の要因の両方に依存することを示します。

MosaicMRI: 多様なデータセットと、生の筋骨格MRIのためのベンチマーク | AI Navigate