Late Fusion のマルチモーダル EHR モデルにおけるモダリティ・ドロップアウトで小児救急外来トリアージを改善する

arXiv cs.LG / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、マルチモーダル・トリアージモデルにおける「モダリティ・コラプス(modality collapse)」に取り組む。具体的には、システムが構造化された表形式のバイタルに過度に依存し、臨床テキストを十分に活用しないことで、小児患者に対する汎化性能が損なわれる。
  • 構造化バイタルには XGBoost、非構造化の臨床ノートには Bio_ClinicalBERT を用いる late-fusion(後期融合)アーキテクチャを提案し、さらに Logistic Regression のメタ分類器で 5 段階の ESI 重症度(acuity)を予測する。
  • 外的妥当性への対応として、モデルは MIMIC-IV と NHAMCS の「成人」エンカウンタのみで学習し、ゼロショットの汎化(zero-shot generalization)により小児コホートでテストする。
  • 学習では対称的なモダリティ・ドロップアウトを用い、欠落したモダリティや過剰に重み付けされたモダリティに対する頑健性を強制する。ドロップアウト率 30〜40% の範囲が、小児評価で最も大きな改善をもたらした。
  • 最も良い報告では、Quadratic Weighted Kappa が 0.351 まで向上しており、著者らはモダリティ・ドロップアウトが臨床 AI におけるモダリティ・コラプスを低減する有効な正則化(regularization)戦略であると主張している。

要旨: 緊急外来のトリアージは、定量的なバイタルサインと、質的な臨床記録の双方に大きく依存している。しかし、トリアージの緊急度(acuity)を予測するマルチモーダル機械学習モデルは、構造化された表形式データに過度に依存することで、モダリティ・コラプス(modalilty collapse)に陥りがちである。この制約は、バイタルサインに発達段階による変動が生じるために、非構造化の臨床ナラティブ(記述)が特に不可欠になる小児患者において、人口統計(デモグラフィック)に対する一般化可能性を著しく損なう。そこで本研究では、表形式のバイタルをXGBoostで処理し、非構造化の臨床テキストをBio_ClinicalBERTで処理する、レイトフュージョン型のマルチモーダル・アーキテクチャを提案する。そして、Logistic Regressionのメタ分類器で統合し、5段階のEmergency Severity Indexを予測する。外的妥当性の問題を明確に狙い、我々のモデルはMIMIC-IVおよびNHAMCSの成人症例のみで学習し、従来見過ごされてきた小児コホートに対してゼロショットで一般化性能を評価する。さらに、学習中に対称的なモダリティ・ドロップアウトを用い、アンサンブルが成人特有の臨床相関に過度に適合しないようにする。我々の結果は、マルチモーダル枠組みが単一モダリティのベースラインを大幅に上回ることを示している。最も注目すべきは、対称的モダリティ・ドロップアウト率を30〜40%に適用した場合、未見の小児コホートで大きな性能向上が得られ、Quadratic Weighted Kappaを0.351まで引き上げた点である。これらの知見は、モダリティ・ドロップアウトが、モダリティ・コラプスを緩和し、臨床AIにおけるデモグラフィック間の一般化を高めるための重要な正則化(regularization)手法であることを示している。