要旨: 診療記録(EHR)の非構造化データ(例えば診療ノート)は、構造化データ項目には直接反映されない臨床的文脈上の観察を含んでいます。この追加情報は、モデルの学習を大幅に改善し得ます。しかし、非構造化であるため、これらのデータはしばしば利用できない、またはモデルをデプロイする際に使用することが実際的ではありません。私たちは、トレーニング中に非構造化EHRデータを活用しつつ、構造化EHRデータのみでデプロイ可能なモデルを生成するマルチモーダル学習の枠組みを提案します。遅れて話し始めたかどうかを評価した3,466人の子どもからなるコホートを用いて、BioClinicalBERTでノート埋め込みを生成し、人口統計情報および医療コードから構造化埋め込みを符号化しました。ノートベースの教師モデルと、構造化のみの学生モデルを、対比学習および対比知識蒸留の損失を用いて共同で学習し、強力な分類器(AUROC = 0.985)を得ました。提案モデルはAUROC 0.705に到達し、構造化のみのベースライン0.656を上回りました。これらの結果は、トレーニング時に非構造化データを組み込むことで、構造化EHRデータ内のタスクに関連する情報を特定するモデルの能力が向上し、デプロイ可能な構造化のみの表現型モデルを実現できることを示しています。
マルチモーダル学習からユニモーダル展開へ:学習中に非構造化データを活用し、構造化データのみの展開を最適化する
arXiv cs.LG / 2026/3/25
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、学習中に非構造化EHR要素(例:診療記録)を用いる一方で、構造化EHRフィールドのみで展開可能なモデルを出力するマルチモーダル学習アプローチを提案する。
- 「教師」モデルでは、ノート埋め込み(BioClinicalBERTによる)と構造化埋め込み(属性情報および医療コード)を活用し、その知識をコントラスト学習とコントラスト型知識蒸留によって、構造化のみの「学生」モデルへ蒸留する。
- 言語発達遅滞の評価を対象とした3,466件の小児症例での実験では、構造化のみで展開されたモデルのAUROCが0.705となり、構造化のみのベースラインAUROCである0.656を上回った。
- これらの結果は、非構造化の臨床的文脈が、推論時に非構造化入力を不要にしたまま、モデルが構造化データのどの側面がタスクに関連するかを学習するのに役立つことを示唆している。
- 本研究は、産業環境で診療記録へのアクセスが制限される、または困難である場合でもフェノタイプ/分類モデルをより実用的に展開できるようにすることを目的として位置づけられている。
