MATA-Former & SIICU: Semantic Aware Temporal Alignment for High-Fidelity ICU Risk Prediction

arXiv cs.LG / 4/3/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

Key Points

  • 本論文は、ICUにおける時間経過の単純な近さではなく、病態の因果的な意味(イベントセマンティクス)を考慮した高精度リスク予測の枠組みとしてMATA-Former(Medical-semantics Aware Time-ALiBi Transformer)を提案しています。
  • MATA-Formerでは、注意(attention)重みをイベントの意味に応じて動的に調整し、時間ラグよりも臨床ロジックの妥当性を優先する設計になっています。
  • 従来の粗い二値ラベルの代わりに、Plateau-Gaussian Soft Labeling(PSL)により二値分類を連続的なマルチホライズン回帰へ再定式化し、リスクの時系列“全軌道”をモデル化します。
  • 評価は新規構築のSIICUデータセット(専門家による厳密・細粒度アノテーション、イベント総数50.6万超)とMIMIC-IVで行われ、テキストを含む不規則な臨床時系列でも優れた有効性と頑健な汎化が示されています。

Abstract

Forecasting evolving clinical risks relies on intrinsic pathological dependencies rather than mere chronological proximity, yet current methods struggle with coarse binary supervision and physical timestamps. To align predictive modeling with clinical logic, we propose the Medical-semantics Aware Time-ALiBi Transformer (MATA-Former), utilizing event semantics to dynamically parameterize attention weights to prioritize causal validity over time lags. Furthermore, we introduce Plateau-Gaussian Soft Labeling (PSL), reformulating binary classification into continuous multi-horizon regression for full-trajectory risk modeling. Evaluated on SIICU -- a newly constructed dataset featuring over 506k events with rigorous expert-verified, fine-grained annotations -- and the MIMIC-IV dataset, our framework demonstrates superior efficacy and robust generalization in capturing risks from text-intensive, irregular clinical time series.