要旨: 医療および公衆衛生の専門家は、大規模な医療上の混乱(例:運用上の障害やパンデミック)の間に、予測される入院動向に基づいて、病床収容力の拡大のような実時間の資源配分の意思決定を行う必要がある。予測モデルは、施設レベルでの資源関連データの大量を分析することでこの作業を支援できるが、現実のデータ状況下で意思決定に資する信頼性が求められる。近年の研究では、大規模言語モデル(LLM)が数値予測において、より豊かな形の文脈を取り込めることが示されている。従来のモデルが主に時間的文脈(すなわち、過去の観測)に依存するのに対し、LLMは、人口統計、地理、人口レベルの特徴といった非時間的な公衆衛生文脈も活用できる。しかし、現実の医療環境において、これらのモデルをどのように用いるべきか、安定した、または意思決定にとって有用な予測をどのように生成すべきかは、依然として明らかではない。この設定においてLLMを効果的に用いる方法を評価するため、米国の60の郡(入院強度が低・中・高の各群)を対象に、3つのアプローチを評価する。すなわち、直接LLMベースの予測、古典的な時系列モデル、そしてLLM由来の信号を構造化されたモデルに組み込む文脈拡張型ハイブリッド・パイプライン(HybridARX)である。本研究の目的は、誤差の最小化だけでなく、運用上の意思決定であるため、標準的な予測指標に加えて、バイアスおよびリード・ラグの整合性を用いて性能を評価する。結果として、HybridARXは、特にノイズを含む文脈信号を構造化された時系列モデルに組み込む場合に、古典的なARXよりも安定性が高く、かつ較正(キャリブレーション)も良好な予測をもたらすことが示された。これらの知見は、非定常な医療資源の予測において、LLMは構造化されたハイブリッドモデル内に埋め込まれたときに最も有用であることを示唆している。
LLMを用いた意思決定支援のための、文脈対応型の入院予測評価
arXiv cs.AI / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究は、大規模な医療・公衆衛生の混乱時におけるリアルタイムの医療資源判断を支えるため、LLMを文脈対応型の入院予測にどう活用できるかを検討している。
- 60の米国郡を対象に、直接LLMによる予測、古典的時系列モデル、そしてLLM由来の信号を構造化モデルに組み込む文脈拡張ハイブリッド手法「HybridARX」の3手法を比較した。
- 予測誤差の最小化だけでなく、バイアスやリード–ラグの整合など意思決定に直結する観点でも評価し、運用上の要請を反映している。
- 結果として、HybridARXは古典的ARXよりも予測が安定し、キャリブレーション(較正)が良好であることが示され、とくにノイズを含む文脈信号を取り込む場合に効果が大きい。
- 非定常な医療資源の予測では、LLMを単独で使うよりも構造化されたハイブリッドモデルに埋め込む形が有効だと結論づけている。

