LLMsを用いた一般化可能なマルチモーダル臨床推論のための、スキーマ適応型タブラー表現学習

arXiv cs.AI / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、構造化された項目を意味的な自然言語の記述へ変換することで、表形式データに対するスキーマ一般化を改善するLLMベースの手法「スキーマ適応型タブラー表現学習」を提案する。
手作業の特徴量エンジニアリングや追加の再学習を行うことなく、未見のEHRスキーマに対するタブラー埋め込みのゼロショットな整合（アラインメント）を可能にする。
著者らは、学習したタブラーエンコーダを、タブラーのEHR特徴とMRIデータを組み合わせることで、認知症診断のマルチモーダルシステムに統合する。
NACCおよびADNIでの実験により、最先端の結果が示され、新しい臨床スキーマへのゼロショット転移が成功し、後ろ向きタスクにおいて臨床ベースラインよりも優れている。
本研究は、LLMによって駆動される意味的なタブラー符号化が、不均一な構造化ヘルスケアデータへLLM推論を適用するための、スケーラブルで頑健な道筋を提供すると主張している。

要旨: 階層（スキーマ）に関する一般化の不十分さにより、表形式データに対する機械学習は依然として制約されています。これは、構造化変数のセマンティック（意味）理解が欠如していることに起因する課題です。この課題は、電子健康記録（EHR）のスキーマが大きく異なる臨床医学のような領域で、特に深刻です。この問題を解決するために、我々はSchema-Adaptive Tabular Representation Learning（スキーマ適応型の表形式表現学習）を提案します。これは、大規模言語モデル（LLM）を活用して転用可能な表形式埋め込みを作成する、新しい手法です。構造化変数を意味のある自然言語の記述文へと変換し、事前学習済みのLLMでそれらを符号化することで、手作業による特徴量設計や再学習を行わずに、未見のスキーマ間でゼロショットの整合（アラインメント）を可能にします。さらに、我々の符号化器（エンコーダ）を、認知症診断のためのマルチモーダル枠組みに統合し、表形式データとMRIデータを組み合わせます。NACCおよびADNIのデータセットでの実験により、最先端の性能が示され、未見スキーマへのゼロショット転移も成功しています。加えて、回顧的な診断タスクにおいて、臨床のベースライン（開業医ではなくboard-certifiedの神経内科医を含む）を大幅に上回ります。これらの結果は、LLMに基づく本アプローチが、異種（ヘテロジニアス）な実世界データに対する、スケーラブルで頑健な解決策であることを裏付けており、構造化領域へLLMベースの推論を拡張するための道筋を提供します。