要旨: 背景: 適切なサンプルサイズを決定することは、信頼性が高く一般化可能な臨床予測モデルを開発するために不可欠である。しかし、適切な方法の選択に関する実践的な指針は依然として限られている。既存の解析的およびシミュレーションベースのアプローチは、多くの場合、制約の大きい仮定に依存し、平均(mean)に基づく基準に焦点を当てている。そこで本研究では、多様な予測設定に対してサンプルサイズ決定を行うための、柔軟で計算効率の高いシミュレーションベースの枠組みを提供する R パッケージ pmsims を提案し、検証する。pmsims は、ガウス過程サロゲートモデリングを用いる。 方法: 我々は、2つの目的を持つ包括的なシミュレーション研究を実施した。第一に、pmsims に実装された3つの探索エンジン(ガウス過程ベースの適応的手法、決定論的二分法、ハイブリッド手法)を、二値、連続、および生存アウトカムにわたって比較した。第二に、最良の性能を示した pmsims のエンジンを、既存の解析的手法(pmsampsize)およびシミュレーションベース手法(samplesizedev)とベンチマークし、推奨サンプルサイズ、計算時間、ならびに大規模な独立検証データセット上で達成された性能を評価した。 結果: ガウス過程ベースの手法は、一貫して最も安定したサンプルサイズ推定を示した。特に、低シグナルで高次元の設定においてその傾向が顕著であった。ベンチマークでは、pmsims は、すべてのアウトカム型にわたり事前に定めた目標に近い性能を達成し、シミュレーションベース手法と同等であり、より困難なシナリオでは解析的手法を上回った。 結論: pmsims は、臨床予測モデリングにおける原理に基づくサンプルサイズ計画のための効率的かつ柔軟な枠組みを提供する。非適応的なシミュレーションアプローチよりも少ないモデル評価で済む。
臨床予測モデルにおけるシミュレーションベースのサンプルサイズ推定のための適応的ガウス過程探索:pmsims Rパッケージの検証
arXiv stat.ML / 2026/3/26
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、柔軟なシミュレーションベースの枠組みを用いて臨床予測モデルのサンプルサイズを推定するための、ガウス過程サロゲートモデリングを活用したRパッケージ「pmsims」を提示し、その検証を行う。
- 二値、連続、および生存アウトカムに関するシミュレーション研究では、ガウス過程に基づく適応的探索エンジンが、特に低シグナルかつ高次元の条件下で、最も安定したサンプルサイズ推奨を実現した。
- 既存の解析的手法(pmsampsize)およびシミュレーションベース手法(samplesizedev)とのベンチマークでは、pmsimsが目標基準に近い性能を達成しつつ、計算負荷を削減した。
- 著者らは、最良のpmsimsアプローチが困難なシナリオにおいてシミュレーションベースの手法と同等の性能を示し、概して純粋に解析的な手法を上回る一方で、非適応的なシミュレーション戦略よりも少ないモデル評価で済むことを報告している。