CDMT-EHR:混合タイプ時系列電子健康記録を生成するための連続時間拡散フレームワーク
arXiv cs.LG / 2026/3/26
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、プライバシーを保護しつつデータ共有する必要性に対応しながら、合成の混合タイプ(数値+カテゴリ)時系列電子健康記録を生成するための連続時間拡散フレームワークであるCDMT-EHRを提案する。
- 双方向のゲート付きリカレントユニット(GRU)をバックボーンとして用い、時間的依存関係を捉え、さらにカテゴリ変数に対するガウス拡散を統一して特徴間の共同モデリングを行うための学習可能な連続埋め込みを導入する。
- 本手法には、特徴およびタイムステップに固有の学習の難易度に適応する、因数分解された学習可能なノイズスケジュールが含まれており、離散時間の拡散アプローチで一般的に生じる近似の問題を低減することを狙う。
- 2つの大規模ICUデータセットでの実験により、ベースライン手法が1,000ステップを用いるのに対し、本手法は50サンプリングステップのみで、下流タスク性能、分布の忠実度、識別性が向上することが示される。
- また、分類器フリー・ガイダンスが、臨床的に関連性の高いクラス不均衡の設定においても、効果的な条件付き生成を支えることを示す。