生存分析と分類の融合:慢性疾患の早期リスク予測モデルの新たなフレームワーク

arXiv cs.LG / 2026/3/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、生存分析と分類を統合して、大規模なEMRデータセットを用いた早期疾患リスク予測モデルを作成する新しいフレームワークを提示します。
  • 本研究は糖尿病、高血圧、CKD(慢性腎臓病)、COPD(慢性閉塞性肺疾患)、慢性虚血性心疾患の5つの慢性疾患を対象とし、生存ベースの手法を再設計して分類を効率的に行えることを示しています。
  • このアプローチは、精度、F1スコア、AUROCの点で、LightGBMやXGBoostなどの最先端モデルと同等かそれ以上の性能を達成します。
  • 提案された生存モデルは、予測を説明する新しい方法論を導入し、3名の専門医パネルによって臨床的に検証されています。

Abstract

慢性疾患は、生涯にわたる医療的注意を要する長期的な状態です。大規模なEMRデータを用いて、糖尿病、高血圧、CKD、COPD、慢性虚血性心疾患という5つの一般的な慢性疾患の早期疾患リスク予測モデルを開発しました。本研究では、生存分析と分類技術を統合することで疾病リスクモデルの新しいアプローチを提示します。慢性疾患のリスク予測の従来のモデルは、主に生存分析または分類のいずれかを独立して焦点としています。本論文では、生存分析の手法を再設計して分類を効率的かつ効果的に実行できるようにすることで、病気リスク監視モデルを開発するための総合的なツールにすることを示します。実世界の大規模なEMRデータを用いた実験の結果、精度、F1スコア、AUROCの観点で、生存モデルの性能はこれまでの最先端モデルであるLightGBMやXGBoostと同等かそれを上回ることが示されています。最後に、提案された生存モデルは、予測を説明する新しい方法論を使用しており、3名の専門医パネルによって臨床的に検証されています。