CNNの転移学習を用いた眼底画像からの網膜疾患分類

arXiv cs.CV / 2026/3/26

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、公開されている眼底画像を用いて、CNNによって二値の網膜疾患リスクを分類するための、再現可能な深層学習パイプラインを提案し、ホールドアウトデータで評価する。
  • 転移学習アプローチとして、事前学習済みのVGG16バックボーンを用いる方法を、ベースラインCNNと比較し、汎化性能に焦点を当てる。
  • クラス不均衡を緩和するために著者らはクラス重み付けを適用し、精度、適合率、再現率、F1スコア、混同行列、ROC-AUCを含む複数の指標を報告する。
  • VGG16の転移学習モデルはテスト精度90.8%および重み付きF1スコア0.90を達成し、ベースラインCNNの精度83.1%を上回る。
  • 本研究は、特に少数派の疾患症例における感度などの、依然として残る課題を強調し、データセットの特性や、臨床的に信頼性の高いスクリーニングのための閾値選択といった実務上の論点について議論する。

Abstract

網膜疾患は、世界中で視覚障害を引き起こす主要な予防可能な原因の一つとして残っています。眼底画像解析に基づく自動スクリーニングは、特に十分な医療サービスを受けられていない集団において、早期検出へのアクセスを拡大する可能性があります。本論文では、公的に入手可能な眼底写真から、網膜疾患リスクを二値分類するための再現可能な深層学習パイプラインを提示します。事前学習済みのVGG16バックボーンを用いた転移学習アプローチと、ベースラインの畳み込みニューラルネットワーク(CNN)を実装し、比較したうえで、保持データ(ホールドアウトデータ)に対する汎化性能を評価します。クラス不均衡に対処するためにクラス重み付けを適用し、精度、適合率(precision)、再現率(recall)、F1スコア、混同行列、ROC-AUCを含む標準的な分類指標を報告します。VGG16の転移学習モデルは、重み付きF1スコア0.90でテスト精度90.8%を達成し、ベースラインCNN(精度83.1%)を大幅に上回りました。結果は、転移学習がベースラインCNNと比べて識別性能を向上させる一方で、少数派の疾患症例に対する感度に残る課題も明らかにすることを示しています。データセットの特性、クラス不均衡、しきい値選択に関連する実務上の制約について議論し、臨床的に信頼できるスクリーニングに向けた再現性と今後の改善のための指針を提示します