FeatEHR-LLM:電子カルテ(EHR)における特徴量エンジニアリングへの大規模言語モデルの活用
arXiv cs.AI / 2026/4/27
💬 オピニオンTools & Practical UsageModels & Research
要点
- FeatEHR-LLMは、不規則にサンプリングされた電子カルテ(EHR)の時系列データから、臨床的に意味のある表形式の特徴量を大規模言語モデル(LLM)で自動生成する枠組みです。
- 観測間隔の不規則性、測定頻度のばらつき、構造的スパース性といったEHR固有の課題に対し、時間データをクエリするツール拡張の仕組みと、観測パターンの不均一性を明示的に扱う特徴抽出コード生成を用いて対応します。
- 患者プライバシーを守るために、LLMは生の患者データではなく、データセットのスキーマとタスク記述のみを使って特徴量を生成します。
- ユニ変量および多変量の特徴量生成を、検証をループに組み込む反復パイプラインでサポートします。
- 4つのICUデータセットの8つの臨床予測タスクで評価した結果、7/8タスクで平均AUROCが最高となり、強力なベースラインに対して最大6ポイントの改善を達成しました。




