要旨: 糖尿病性網膜症(DR)は予防可能な失明の主要な原因であり、自動的な眼底像のグレーディングは大規模スクリーニングにおいて重要な役割を果たします。本研究では、5クラスのDR重症度グレーディングのための3つのCLIPベースのアプローチを検討します:(1) プロンプトエンジニアリングを用いたゼロショットのベースライン、(2) CBAM注意機構を組み込んだハイブリッドFCN-CLIPモデル、(3) DR進行の順序構造をエンコードするランキング認識プロンプトモデル。APTOS 2019とMessidor-2の結合データセット(n=5,406)で訓練・評価を行い、リサンプリングとクラス別最適閾値を用いてクラス不均衡に対処します。我々の実験は、ランキング認識モデルが総合精度で最高値を達成することを示します(93.42%、AUROC 0.9845)および臨床的に重要な重度ケースでの高いリコールを示します。一方、ハイブリッドFCN-CLIPモデル(92.49%、AUROC 0.99)は増殖性DRの検出に優れています。両者はゼロショットベースライン(55.17%、AUROC 0.75)を大幅に上回ります。各アプローチの補完的な強みを分析し、スクリーニング文脈における実用的な意味合いを論じます。
CLIPベースのランキング認識適応による糖尿病性網膜症のグレーディング:眼底画像に関する比較研究
arXiv cs.CV / 2026/3/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究は、糖尿病性網膜症の5クラス重症度グレーディングのための3つのCLIPベース手法を検討する:ゼロショットベースライン(プロンプト設計)、CBAMアテンションを備えたハイブリッドFCN-CLIPモデル、そして糖尿病性網膜症の序列的進行を捉えるランキング認識プロンプトモデル。
- 著者らはAPTOS 2019とMessidor-2を結合したデータセット(n=5,406)で訓練・評価を行い、クラス不均衡にはリサンプリングとクラス別閾値設定を用いて対処している。
- 結果は、ランキング認識モデルが総合正解率93.42%、AUROC0.9845を達成し、重篤な症例のリコールが高い。一方、FCN-CLIPモデルは総合正解率92.49%、AUROC0.99で増殖性DRの検出に優れる。ゼロショットベースラインは総合正解率55.17%、AUROC0.75で劣る。
- 本論文は、各アプローチの補完的な強みを分析し、DRスクリーニングの文脈における実用的な示唆を論じる。
