LoV3D: 地域体積評価を用いた縦断的3D脳MRIに基づく認知予後推論の根拠づけ
arXiv cs.CV / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- LoV3Dは、縦断的T1強調脳MRIを読み取り、領域レベルの解剖評価と縦断的比較を出力する3D視覚言語モデル訓練パイプラインを導入し、最終的に3クラスの認知診断(健常認知、軽度認知障害、認知症)と統合診断サマリーを提供します。
- このアプローチは、ラベルの整合性、縦断的整合性、生物学的妥当性を強制することで最終診断を根拠づけ、幻覚のリスクを低減します。
- 臨床的に重みづけられたVerifierを訓練し、標準化された体積指標から得られる規範参照と照合して候補出力を評価することで、人手のアノテーションなしにDirect Preference Optimizationを可能にします。
- 被験者レベルのホールドアウトADNIテストセット(479スキャン、258被験者)において、LoV3Dは3クラス診断精度93.7%(グラウンディングなしのベースラインより+34.8%の改善)、2クラス診断精度97.2%、領域レベルの解剖分類精度82.6%(VLMベースラインより+33.1%)を達成し、ゼロショット転移はMIRIADで95.4%(認知症リコール100%)、AIBLで3クラス精度82.9%を示し、サイト・機器・集団を跨ぐ高い一般化性を確認しています。コードは提供されたGitHubリポジトリに公開されています。
長期的な脳MRIは、アルツハイマー病などの神経疾患の進行を特徴づける評価に不可欠です。しかし、現在の深層学習ツールはこの過程を断片化します。分類器はスキャンをラベルに縮小し、体積ベースのパイプラインは解釈されていない測定値を生成し、視覚−言語モデル(VLMs)は流暢ですが潜在的に幻覚的な結論を生み出すことがあります。私たちはLoV3Dを提示します。LoV3Dは3D視覚-言語モデルを訓練するパイプラインで、縦断的T1強調脳MRIを読み取り、領域レベルの解剖評価を作成し、前回のスキャンと縦断的比較を行い、最終的に3クラスの診断(健常認知、軽度認知障害、認知症)と統合診断サマリーを出力します。この段階的パイプラインはラベルの整合性、縦断的整合性、生物学的妥当性を遵守することにより最終診断を根拠づけ、幻覚のリスクを低減します。訓練プロセスでは臨床的に重みづけられたVerifierを導入し、標準化された体積指標から得られる規範参照と照合して候補出力を自動的に評価することで、いかなる人間のアノテーションも必要とせずDirect Preference Optimizationを推進します。被験者レベルのホールドアウトADNIテストセット(479スキャン、258被験者)において、LoV3Dは3クラス診断精度93.7%(グラウンディングなしのベースラインに対して+34.8%の改善)、2クラス診断精度97.2%、領域レベルの解剖分類精度82.6%(VLMベースラインより+33.1%)、ゼロショット転移はMIRIADで95.4%(100% Dementia recall)、AIBLでは3クラス精度82.9%を示し、サイト、スキャナー、集団全体にわたる高い汎用性を確認しています。コードはhttps://github.com/Anonymous-TEVC/LoV-3Dに公開されています。