要旨: 私たちは、不規則にサンプリングされた患者の軌跡から治療を最適化するための保守的な連続時間確率制御フレームワークを開発します。未知の患者ダイナミクスは、治療を連続時間の制御として扱う制御付き確率微分方程式としてモデル化されます。素朴なモデルベースの最適化はモデル誤差を利用して支援外の制御を提案することがあり、推定されたダイナミクスを最適化しても真のダイナミクスを最適化できない可能性があります。外挿を制限するため、観測された軌跡から逸脱するように誘導される軌跡分布を罰する、経路空間上の一貫したシグネチャベースのMMD正則化項を追加します。得られる目的関数は真のコストの計算可能な上限を最小化します。ベンチマークデータセットを用いた実験は、非保守的なベースラインと比較して頑健性と性能の向上を示しています。
保守的な連続時間治療の最適化
arXiv cs.LG / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 不規則にサンプリングされた患者の軌跡から治療を最適化するための保守的な連続時間確率制御フレームワークを提案する。
- 患者のダイナミクスを、治療を連続時間の制御変数として機能させる制御された確率微分方程式としてモデル化する。
- 外挿誤差を抑制するため、経路空間上で一貫したシグネチャベースのMMD正則化を追加し、導出される軌道分布が観測データから逸脱するプランにペナルティを課することで、真のコストの計算可能な上限を得られる。
- ベンチマークデータセットでの実験は、非保守的なベースラインと比較して頑健性と性能の向上を示した。