インフルエンザの時空間予測のための生成的拡散モデル

arXiv cs.LG / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Influpaintは、インフルエンザの発生(incidence)の予測を生成的ディフュージョンモデル(denoising diffusion probabilistic models)で行う手法です。
  • 季節データを「発生量をピクセル強度とする spatiotemporal な画像」に符号化し、監視データとシミュレーション軌跡を組み合わせた学習で、疫学ダイナミクスの多様な不確実性を分布として学習します。
  • 予測は部分観測からの条件付き生成(inpainting)として定式化され、現実的で多様な流行軌跡を生成し、レトロスペクティブ評価では主要なアンサンブル手法と競争力のある精度を示しました。
  • 2023〜2025年の米CDC FluSightチャレンジのリアルタイム評価ではシーズン全体で性能が大きく改善しましたが、特に2024〜2025年は「精度は高いがやや過信(overconfident)」な予測になった点も報告されています。
  • 最良性能は、学習データを「監視30%+シミュレーション70%」の構成にしたときに得られ、拡散モデルがインフルエンザの時空間構造を捉え、確率的な感染症予測の柔軟な枠組みになることを示唆しています。

要旨: 感染症の発生数を予測することは公衆衛生計画の指針となる重要な情報を提供し得ますが、流行のダイナミクスが複雑であるため難しい課題です。現在のメカニスティックおよび統計的アプローチは、多峰性の不確実性や新たに生じるトレンドを捉えることにしばしば苦戦しています。Influpaintは、流行予測にデノイジング拡散確率モデルを適用します。インフルエンザの季節を、画素の強度が発生数を表す時空間画像として符号化することで、Influpaintは、監視データとシミュレーションされた軌跡から成るハイブリッドなデータセットにより、疾病ダイナミクスの豊かな分布を学習します。予測は、部分的な観測からの条件付き生成(インペインティング)課題として定式化されます。Influpaintは、現実的で多様な流行の軌跡を生成でき、さらに回顧的評価において主要なアンサンブル手法と競争力のある予測精度を達成することを示します。2023--2025年の米国CDC FluSightチャレンジにおけるリアルタイム評価では、季節を通じて性能が大幅に改善し、2024--2025年には非常に高精度である一方、やや過度に確信を持つ(過信的な)予測が見られました。最良の性能は、監視データ30%とシミュレーションされた軌跡70%を含む学習データセットで達成されました。これらの結果は、拡散モデルがインフルエンザのダイナミクスにおける重要な時空間構造を捉え、確率的な感染症予測のための柔軟な枠組みを提供し得ることを示しています。