両眼(OU)超広角眼底画像による高度近視診断のためのコプラ強化ビジョントランスフォーマー
arXiv cs.CV / 2026/5/4
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、両眼(OU)の超広角眼底画像から「両眼での高度近視の診断(2値)」と「眼軸長(連続値)の予測」の2つを同時に行うAI支援スクリーニングを目的としている。
- そのために、基盤となるビジョントランスフォーマーモデルへ残差アダプタを導入し、2眼間の類似性と異質性の両方を捉える設計を提案している。
- 出力が2値と連続値の混在となるマルチタスク学習に対して、条件付き依存関係をガウスコプラ尤度で表す4次元コプラ損失を導入し、PyTorchで実装可能にしている。
- コプラパラメータ推定のために、計算効率の高いfast Monte Carlo Expectation Maximization(fMCEM)アルゴリズムを開発し、マルチタスクの過学習問題として定義した「stronger covariance phenomenon」に対して数値安定性を理論的に示している。
- 注釈付きのOU超広角眼底画像データセットと合成データでの評価により、提案手法が分類・回帰の両タスクで予測性能を安定して向上させることを示している。




