要約: 正確な手術所要時間の予測は病院の資源管理にとって極めて重要です。最近の教師あり学習のアプローチ—機械学習(ML)から微調整済みの大規模言語モデル(LLMs)まで—は高い性能を示してきましたが、それらは高品質なラベル付きデータと計算集約的な学習の必要性という制約を受けています。
対照的に、ゼロショットLLM推論はトレーニングを要しない有望な代替手段を提供しますが、機関固有の臨床文脈(例: 地域の人口統計と症例混合分布)に基づく grounding が欠如しており、予測は臨床的に不一致で不安定になりがちです。
この制限を解決するため、PREBAを提案します。retrieval-augmented フレームワークは PCA加重検索とベイズ平均化による集約を組み合わせ、LLMの予測を機関特有の臨床エビデンスと統計的事前情報に根拠づけます。
PREBAの核は、LLMのためのエビデンスベースのプロンプトを構築することで、(1) 臨床的に最も類似した過去の外科手術ケースと (2) 臨床統計的事前情報を含みます。
これを実現するため、PREBAは異種の臨床特徴を統一表現空間にエンコードし、体系的な検索を可能にします。
その後、PCA加重検索を実行して臨床的に関連する過去のケースを特定し、それらがLLMに提供される証拠コンテキストを形成します。
最後に、PREBAはベイズ平均化を適用して、複数回のLLM予測と集団レベルの統計的事前情報を統合し、校正済みで臨床的に妥当な所要時間推定を得ます。
私たちは、Qwen3、DeepSeek-R1、HuatuoGPT-o1を含む3つの最先端LLMを用いて、2つの実世界の臨床データセットでPREBAを評価します。
PREBAは性能を顕著に改善し、例えばゼロショット推論と比較してMAEを最大40%低減し、R^2を-0.13から0.62へ改善します。また、監視付きML法と競合する精度を達成し、強力な有効性と一般化を示しています。
PREBA: PCA重み付け付き検索拡張LLMsとベイズ平均化集約による手術時間予測
arXiv cs.LG / 2026/3/17
📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- PREBAは、PCA重み付けされた検索とベイズ平均化を用いて、施設特有の臨床文脈に基づくLLMベースの手術時間予測を支える検索補助型フレームワークを導入します。
- このアプローチは、臨床的に類似した過去の症例と母集団事前情報からエビデンスに基づくプロンプトを構築し、予測のキャリブレーションと臨床的妥当性を向上させます。
- 異種の臨床特徴を統一表現にエンコードして体系的リトリーブを可能にし、複数回のLLM出力と事前情報をベイズ平均化で融合します。
- 実データセット2件と3つのLLMを用いた実証評価により、MAEを最大40%削減し、R^2を-0.13から0.62へ改善し、教師あり法の性能に近づくことを示しました。

