MedSR-Vision:複数ドメイン対応の医用画像超解像のためのディープラーニングフレームワーク

arXiv cs.CV / 2026/5/6

📰 ニュースModels & Research

要点

  • MedSR-Visionは、×2、×3、×4の拡大率に対応し、5つのモダリティ(MRI、CT、X線、超音波など)で医用画像超解像モデルを評価・比較するための統一型ディープラーニングフレームワークとして提案されています。
  • SRCNN、SwinIR、Real-ESRGANの代表的な超解像モデルを、忠実性(fidelity)、知覚的なリアリティ、鮮鋭度を目的とした複数の定量指標でベンチマークしています。
  • 実験結果では、Real-ESRGANは高い拡大率で知覚品質と輪郭(エッジ)復元が優れる一方、SwinIRは構造的かつ診断に関わる特徴の保持がより良いとされています。
  • SRCNNは低い拡大率で特に効率的かつ安定した性能を示すとしており、臨床の画像ワークフローにおける実用的なトレードオフを提供すると述べられています。
  • 著者らは、標準化された評価基盤がモデル選定のためのドメイン別の指針を与え、今後の医用超解像研究と実運用を後押しするとしています。

概要: 医用画像超解像(MedSR)は、MRI、CT、X線、超音波、眼底撮影といった多様な画像モダリティにわたって診断精度を向上させるために不可欠である。深層学習の急速な進展にもかかわらず、解剖学的正確性の保持、知覚品質の維持、医療領域をまたいだ一般化には依然として課題が残っている。本論文では、5つのモダリティ(脳MRI、胸部X線、腎臓超音波、腎結石CT、脊椎MRI)において、倍率スケール imes2 imes3 imes4 の下で、超解像モデルを評価し比較するための新しい統一型深層学習フレームワーク「MedSR-Vision」を提案する。SRCNN、SwinIR、Real-ESRGAN の3つの代表的モデルを、忠実性、知覚的な現実感、鮮鋭性を含む複数の定量指標によってベンチマークする。
実験的分析により、高い倍率スケールでは Real-ESRGAN が優れた知覚品質とエッジ回復を達成し、SwinIR は構造的および診断上の特徴の保持に優れ、SRCNN は低い倍率で効率的かつ安定した性能を提供することが示される。これらの結果は、領域に固有の洞察と、臨床画像ワークフローにおけるモデル選択のための実践的指針を確立する。さらに、将来の医用画像超解像研究および展開のための標準化された評価フレームワークを提供する。