入力解像度が網膜血管セグメンテーション性能に与える影響:5つのデータセットにまたがる実証研究

arXiv cs.CV / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、GPUの制約に適合するように眼底画像をリサイズすると、セグメンテーションネットワークに到達する前に細い網膜血管がサブピクセル構造へと変換され、それが不可逆的に消失し得ることを示している。
  • 5つのデータセット(DRIVE、STARE、CHASE_DB1、HRF、FIVES)に対して、ダウンサンプリング比を変えながらベースラインのU-Netを学習する実験により、細い血管の検出に関してデータセット依存の影響が明らかになった。
  • 高解像度データセット(HRF、FIVES)では、画像をエンコーダの実効的な動作範囲へ近づくようにダウンサンプリングすると、細い血管の感度が向上し、処理後の幅が256〜876ピクセルの範囲で最大となる。
  • 低〜中解像度データセット(DRIVE、STARE、CHASE_DB1)では、細い血管の感度はネイティブ解像度で、またはそれに近いところで最も良く、どのダウンサンプリングでも劣化する。
  • 著者らは、幅(width)に基づいて層別化した感度指標を導入し、細い血管の性能が最大15.8ポイント低下しても、一般的なDiceスコアは比較的安定したままになり得ることを示している。したがって、Diceのみでは微小血管の評価として不十分である。

Abstract

網膜血管セグメンテーションのためのほとんどの深層学習パイプラインでは、GPUメモリの制約を満たし、均一なバッチ処理を可能にするために眼底画像をリサイズします。しかし、このリサイズが細い血管の検出に与える影響は十分に調査されていません。高解像度画像をダウンサンプリングすると、細い血管がサブピクセル構造に縮小され、データがネットワークに入力される前から取り返しのつかない情報損失が生じます。Diceスコアのような標準的なボリューム指標では、評価が太い血管の画素に支配されるため、この損失を捉えられません。本研究では、DRIVE、STARE、CHASE_DB1、HRF、FIVESの5つの眼底データセットに対して、ネイティブ幅が565〜3504ピクセルの範囲となるように複数のダウンサンプリング比でベースラインのUNetを学習し、その他の設定はすべて固定しました。そこで、細い(半幅 <3ピクセル)、中程度(3〜7ピクセル)、太い(>7ピクセル)血管の検出をそれぞれ別に評価する、幅に基づく感度(width-stratified sensitivity)指標を提案します。これは、ユークリッド距離変換に由来するネイティブ解像度の幅推定を用いて算出します。結果は、高解像度データセット(HRF、FIVES)では、画像をエンコーダの実効的な動作範囲へ向けてダウンサンプリングしていくほど細い血管の感度が単調に改善し、処理後の幅が256〜876ピクセルの範囲で最大になることを示しています。一方、低〜中解像度データセット(DRIVE、STARE、CHASE_DB1)では、細い血管の感度はネイティブ解像度で、またはその近傍で最も高く、いかなるダウンサンプリングでも低下します。5つのすべてのデータセットにおいて、攻めたダウンサンプリングは細い血管の感度を最大で15.8パーセントポイント(DRIVE)低下させましたが、Diceは比較的安定していました。これにより、Diceだけでは微小血管のセグメンテーションを評価するのに不十分であることが確認されました。