洪水リスクは谷間に沿い、グリッドには従わない:ヒマーチャルプラデーシュ州におけるフラッシュ洪水感受性マッピングのグラフニューラルネットワークとコンフォーマル不確実性量化

arXiv cs.LG / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 流域接続グラフ上のグラフニューラルネットワーク(GraphSAGE)は、ヒマーチャルプラデーシュ州のフラッシュ洪水感受性マッピングにおいて画素ベースのモデルを上回り、AUCは0.978±0.017、ベースラインは0.881であった。
  • 本研究は、6年間のSentinel-1 SAR洪水データと解像度30mの12種類の環境変数を用い、過度に楽観的な分割を避けるためにleave-one-basin-out交差検証で評価した。
  • コンフォーマル予測は、ヒマーチャルプラデーシュ州初の感受性マップを90%カバレッジ区間付きで提供し、統計的に保証された不確実性の境界を提示する。
  • 高感受性域は高速道路、橋梁、水力発電所などの重要インフラと重なっており、計画およびリスク管理への実用的な関連性を示している。
  • SARラベルノイズは高リスク領域のカバレッジを45–59%低下させることを発見し、データラベリングの将来的な改善が示唆される。

要旨: 豪雨洪水はインドのヒマーチャルプラデーシュ州(HP)で最も破壊的な自然災害であり、2023年のモンスーン期だけで400人を超える死者と12億ドルの損失を引き起こしています。既存のリスクマップは各ピクセルを独立して扱い、上流の洪水が下流のリスクを高めるという基本的な事実を無視しています。私たちは、流域接続グラフ(460のサブ流域、1,700の有向エッジ)上で訓練されたグラフニューラルネットワーク(GraphSAGE)を用いてこれに対処します。このグラフは、6年間のSentinel-1 SAR洪水インベントリ(2018-2023、3,000件のイベント)と30 m分解能の12の環境変数から構築されています。4つのピクセルベースのMLモデル(RF、XGBoost、LightGBM、スタッキング・アンサンブル)がベースラインとして機能します。すべてのモデルは、ランダム分割による5〜15%のAUC過大評価を避けるため、流域を1つ除外した空間的交差検証で評価されます。適合予測は、統計的に保証された90%のカバレッジ区間を備えた、初のHP感受性マップを生成します。

GNNはAUC = 0.978 +/- 0.017を達成し、最良のベースライン(AUC = 0.881)および公表済みのHPベンチマーク(AUC = 0.88)を上回りました。+0.097の向上は、川の連結性がピクセルベースのモデルが見逃す予測信号を運ぶことを示しています。高感受性ゾーンは1,457kmの高速道路(うち217kmはManali-Leh回廊を含む)、2,759の橋梁、そして4つの主要な水力発電設備と重なる。適合区間は、保持外の2023年テストセットで82.9%の経験的カバレッジを達成しましたが、高リスクゾーンでのカバレッジは低く(45-59%)、SARラベルのノイズが今後の課題であることを示しています。