縦断網膜画像予測においては、フレームワーク選択よりも学習・推論入力のアラインメントが重要である

arXiv cs.CV / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、進行性黄斑疾患に対する縦断的な網膜画像の将来予測を対象に、生成モデルの複雑さが本当に必要か、それとも入力アラインメントがより重要かを検証する。
同一アーキテクチャとデータセットを用いた5つの条件付け／学習−推論設定の制御比較により、学習時と推論時の入力分布を一致させることでSSIM指標が大きく改善することが示された（delta-SSIM +0.082、SSIM +0.086、いずれもp < 0.001）。
一方で、アラインメント済みフレームワーク同士の選択は主要評価指標に有意な差をもたらさず、主要因は「入力分布のアラインメント」であることが示唆される。
機序解析では、訪問間の変化は時間不変の撮影ばらつきに比べて小さく、確率的サンプリングの幅を活かす余地が小さいため、なぜ単純化したアラインメント手法が有効なのかを説明する。
これらの知見に基づき、TRU（Temporal Retinal U-Net）を提案する。時刻差を連続条件付けし、多尺度の履歴集約を行う決定論的回帰モデルで、複数プラットフォーム・複数タスク（計28,902眼）において既存の最先端ベンチマークを上回る／同等の性能を示し、利用可能な履歴長が長いほど優位性が単調に増大した。