患者の臨床的トラジェクトリにおける欠損モダリティの取り扱いと解釈:自己回帰シーケンスモデリングによるアプローチ

arXiv cs.AI / 2026/4/22

💬 オピニオンModels & Research

要点

  • 本論文は、ヘルスケアのマルチモーダルMLにおける欠損モダリティの課題に対し、臨床診断を患者のマルチモーダル・トラジェクトリの自己回帰的なシーケンスモデリングとして捉え直すことで解決を図っています。
  • 欠損状態のある複数モダリティを扱うために、欠損を考慮したコントラスト学習の事前学習目的を提案し、欠損があってもモダリティ間で共有潜在空間を学習します。
  • 大規模言語モデル(LLM)の因果デコーダを用いて、時間的な臨床シグナルをモデリングしつつ、解釈可能性の維持を目指します。
  • MIMIC-IVおよびeICUの微調整ベンチマークで、トランスフォーマ型の自己回帰シーケンスモデリングがベースラインより優れた性能を示したと報告されています。
  • 解釈可能性の分析では、モダリティを取り除くと患者滞在ごとにモデル挙動が分岐し得ることが示され、コントラスト学習による事前学習がその緩和に寄与することが明らかにされています。

Abstract

医療向けのマルチモーダル機械学習(ML)モデルを開発する上での、現在進行中の重要な課題は、学習時およびデプロイ時に欠損しているモダリティをどう扱うかです。臨床データセットは本質的に時系列であり、モダリティの存在状況という点でも疎であるため、診断に基づくマルチモーダルMLモデルによって基盤となる予測信号を捉えつつ、モデルの説明可能性を維持することは、引き続き難題として残っています。本研究では、臨床診断を自己回帰のシーケンスモデリング課題として再定式化し、大規模言語モデル(LLM)に由来する因果デコーダを用いて、患者のマルチモーダルな軌跡をモデル化することでこの問題に取り組みます。まず、欠損状況に配慮したコントラスト学習の事前学習目的を導入し、共有された潜在空間において欠損があるデータセット内で複数のモダリティを統合します。次に、トランスフォーマー型アーキテクチャによる自己回帰シーケンスモデリングが、MIMIC-IVおよびeICUの微調整ベンチマークにおいてベースラインを上回ることを示します。最後に、解釈可能性の手法を用いて単なる性能向上を超え、様々な患者滞在においてモダリティを取り除くと発散した挙動が生じることを見出し、この発散を我々のコントラスト事前学習が緩和することを確認します。臨床診断をシーケンスモデリングとして抽象化し、患者滞在の軌跡を解釈することで、欠損モダリティをプロファイルし対処するための枠組みを構築しつつ、安全で透明性の高い臨床AIという、典型的な要求事項にも対応します。