網膜構造を考慮した教師なしによるOCT画像中の異常の検出・局在化

arXiv cs.LG / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、OCT（光干渉断層計）解析における重要な課題である「専門家による病変アノテーションの高コスト・手間」を、異常ラベルを必要としない教師なし異常検出手法で解決することを目指している。
正常なBスキャンを用いて離散潜在モデルで健康な網膜の分布を学習し、推論時には再構成の不一致（reconstruction discrepancies）によって異常を検出・局在化する。
臨床での頑健性を高めるため、網膜層に着目した教師あり要素と、構造化トリプレット学習を組み合わせて、異なる撮像装置や患者集団にわたって健康状態と病的表現をより明確に分離する。
実験ではKermanyデータセットでAUROC 0.799、Srinivasanでのクロスデータセット評価でAUROC 0.884と高い汎化性能を示し、外部ベンチマークRET UCHではセグメンテーション性能（Dice 0.200、mIoU 0.117）も競争力のある結果となっている。
総じて、本手法は施設間の再現性を示し、VAE/VQVAE/VQGAN系やf-AnoGANを含む複数の教師なしベースラインより良い性能を達成している。

概要: 光干渉断層撮影（OCT）画像の信頼できる自動解析は、網膜疾患の診断にとって重要ですが、重大な障壁に直面しています。それは、費用が高く、手間のかかる専門家による注釈が必要だという点です。教師ありの深層学習モデルは、注釈付きの異常に関する語彙が限られているため、多様な病理、撮像装置、患者集団にまたがって一般化することに苦労します。我々は、病変の注釈なしで健康な網膜解剖の規範的な分布を学習する教師なし異常検出の枠組みを提案し、臨床導入における注釈効率の課題に直接取り組みます。我々のアプローチは、正常なBスキャンで訓練された離散潜在モデルを活用し、OCT特有の構造パターンを捉えます。臨床的な頑健性を高めるために、網膜層を意識した教師あり信号と、構造化されたトリプレット学習を組み込み、健康な表現と病理的な表現を分離することで、多様な撮像条件にわたるモデルの信頼性を向上させます。推論時には、再構成の不一致により異常を検出し局在化し、疾患特化のラベルを必要とせずに、画像レベルおよびピクセルレベルの両方で識別を可能にします。Kermanyデータセット（AUROC: 0.799）では、本手法はVAE、VQVAE、VQGAN、f-AnoGANのベースラインを大幅に上回ります。さらに重要なのは、Srinivasanにおけるデータセット間評価でAUROC 0.884を達成し、一般化性能が優れていることを示し、頑健なドメイン適応を実証している点です。外部のRETOUCHベンチマークでは、教師なし異常セグメンテーションが競争力のあるDice（0.200）およびmIoU（0.117）スコアを達成し、施設間での再現性を検証します。