CURE-OOD:生存予測における外れ分布(OOD)検出のベンチマーク

arXiv cs.CV / 2026/5/4

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、画像取得条件の変化によって外れ分布(OOD)が生じる状況を制御しつつ、生存予測におけるOOD検出を体系的に評価する新しいベンチマーク「CURE-OOD」を提案しています。
  • 既存の生存予測研究では、CT画像ベースのモデルがスキャナや撮像条件の違いによりOODサンプルを含み、信頼性が損なわれうるものの、OOD検出を体系的に扱うベンチマークが不足していました。
  • CURE-OODは、スキャナパラメータに基づく学習分割と、in-distribution(ID)およびOODのテスト分割を、4つの生存予測タスクにわたって定義しています。
  • 実験の結果、共変量シフトは生存予測の性能を大きく低下させ、さらに生存予測では分類向けの主流なOOD検出器がうまく機能しないことが示されています。
  • OOD検出のためのシンプルな生存に配慮した基準ベースラインとして「HazardDev」も提供し、比較や分析を進めやすくしています。

Abstract

``「がんになった後、どれくらい生きてがんを患わずにいられるのか?」'' は、患者ががんの診断と治療を受けた後に最初に尋ねることが多い質問です。正確な生存予測は、心理的な苦痛を和らげ、リスク層別化や個別化した治療計画を支援します。近年の生存予測の枠組みでは、計算機断層撮影(CT)画像を用いることで強い性能が示されています。しかし、画像の取得にはばらつきがあるため、共変量シフトによって分布外(OOD)サンプルが生じ、モデルの信頼性が損なわれます。この課題にもかかわらず、我々の知る限り、がんの生存予測におけるOOD検出を系統的に研究する既存のベンチマークはありません。このギャップを埋めるために、我々は、制御された取得による分布シフトのもとで、生存予測におけるOOD検出を体系的に評価するための最初のベンチマークである、Cancer sURvival bEnchmark for OOD Detection(CURE-OOD)を提案します。CURE-OODは、4つの生存予測タスクに対して、スキャナ・パラメータに基づく学習、分布内(ID)、およびOODテストの分割を定義します。実験の結果、共変量シフトは生存予測の性能を著しく低下させることが示されます。また、生存予測において、主流の分類指向型のOOD検出器が失敗する可能性も示されます。最後に、OOD検出のためのシンプルな生存を考慮した参照ベースラインとして、HazardDevを追加します。CURE-OODは、分布シフトが下流の生存予測性能とOOD検出可能性の両方にどのように影響するかを体系的に分析することを可能にします。