説明可能性・公平性・可観測性を統合した入院再入院予測フレームワーク:MIMIC-IVでの開発と検証

arXiv cs.LG / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、臨床実装における障壁(説明可能性の不足、デプロイ時の信頼性/可観測性基盤の欠如、人口統計学的公平性評価の不足)を同時に解消する統合フレームワークを提案し、遡及的に検証した。
  • MIMIC-IVの成人入院415,231件の後ろ向きコホートを用い、ロジスティック回帰、XGBoost、LightGBMを26の特徴量で学習し、患者ごとの説明としてSHAPを適用した。
  • 評価はAUC-ROCに加え、16サブグループにわたる公平性指標(AUC-ROC、偽陰性率、陽性的中率)や、Brierスコアとキャリブレーション曲線によるキャリブレーションで行われた。
  • XGBoostはAUC-ROC 0.696(95% CI 0.691–0.701)を達成しLACEベースライン(AUC 0.60–0.68)と比べて良好、LightGBMは最良のキャリブレーション(Brier 0.146)を示し、全サブグループで公平性の閾値を満たした。
  • 結論として、競争力のある性能に加え臨床的に行動可能な説明と高い人口統計学的公平性を提供するとし、コードはGitHubで公開されている。

要旨: 目的: 再入院予測の臨床導入を阻む3つの障壁(説明可能性の欠如、デプロイの信頼性インフラの不在、人口統計学的な公平性評価の不十分さ)に対処する統合的枠組みを提案し、遡及的に検証すること。

材料と方法: MIMIC-IVデータベースから415,231件の成人入院を対象とするコホートを構築した(30日再入院の有病率18.0%)。データを70/15/15に分割し、ロジスティック回帰、XGBoost、LightGBMの各モデルを26の特徴量で学習させた。SHAPにより患者ごとの説明を提供した。公平性は、AUC-ROC、偽陰性率(FNR)、陽性的中率(PPV)を用いて16のサブグループにわたって評価した。校正はBrierスコアおよび校正曲線により評価した。

結果: XGBoostはAUC-ROC 0.696(95% CI 0.691-0.701)を達成し、LACEベースライン(AUC 0.60-0.68)を上回るか同等の性能を示した。LightGBMは最良の校正を達成した(Brier 0.146)。先行入院が主要な予測因子であった。すべてのサブグループが公平性の閾値を満たした(delta AUC <= 0.05、delta FNR <= 0.10)。

結論: 本枠組みは、競争力のある性能、臨床的に実行可能な説明、そして強固な人口統計学的公平性を提供する。コードは https://github.com/Tomisin92/readmission-prediction で公開されている。