概要: 臨床における意思決定では、費用がかかる、侵襲的である、または時間を要する検査を選択することがしばしばあり、それにより、何を測定し、いつ中止するかを確かめるための、個別化された逐次戦略が動機づけられる。 本研究では、事後の結果に応じて検査の利用可能性が決まるために、情報を含む欠測(missingness)が生じるという状況のもとで、後ろ向きデータからコスト最適な逐次決定方策を学習する問題を扱う。 逐次欠測がランダム(missing-at-random)という機構のもとで、最適方策を推定するための二重にロバストなQ学習の枠組みを開発する。 この手法は、異質な検査の軌跡を説明する経路特異的な逆確率重みを導入し、観測された履歴に条件づけた正規化の性質を満たす。 さらに、これらの重みと補助的な対比(contrast)モデルを組み合わせることで、いずれか一方—獲得(acquisition)モデルまたは対比モデル—が正しく指定されている場合に、公平な(unbiased)方策学習を可能にする直交した擬似アウトカムを構築する。 我々は、段階ごとの対比推定量についてオラクル型不等式を示すとともに、学習された方策に対する収束率、後悔(regret)境界、誤分類率を確立する。 シミュレーションにより、重み付けおよび完全症例(complete-case)のベースラインに比べて、コスト調整後の性能が改善されることを示す。 また、前立腺がんのコホート研究への適用により、この手法が予測精度を損なうことなく検査コストを削減できることを示す。
二重ロバストQ学習による費用最適な逐次テスト
arXiv stat.ML / 2026/4/14
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、過去データから費用最適な逐次的な臨床検査方策を学習する方法を研究する。ここでは、前の結果に応じて将来の検査が欠測しうる(情報量のある欠測)
- 情報が欠測する過程について逐次的な「欠測がランダムである(missing-at-random)」という仮定のもとで、パス特有の逆確率重み付けと補助コントラストモデルを用いることで検査軌道の異質性を扱う、二重ロバストなQ学習フレームワークを提案する
- 本手法は、獲得(欠測)モデルまたはコントラストモデルのいずれかが正しく指定されていれば、偏りのない方策学習を導く直交な擬似アウトカムを構成する
- 著者らは、段階ごとの推定量に対する理論的保証(オラクル不等式、収束率、後悔および誤分類の上界)を提示し、シミュレーションおよび前立腺がんコホートへの適用により、費用調整後で性能が向上することを検証している




