空間的共変量シフト下での適合的PM2.5マッピング:衛星・再解析融合によるアフリカのグリーン産業移行支援

arXiv cs.LG / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • 本研究は、アフリカの大気質モニタリングに向けた衛星・再解析によるPM2.5融合システムを提案しており、29カ国・404地点の地上観測から2.06百万件超のデータで学習します。
  • 地理的なリークを抑える空間クロスバリデーションと適合性予測(conformal prediction)を用いて、頑健性を高めつつ、予測がどの地域で適用可能かを定量化します。
  • 5分割の「ロケーショングループ化された」空間クロスバリデーションでは、RMSE 30.83±5.07 µg/m3、MAE 14.54±1.66 µg/m3、R2 0.134±0.023が報告され、低いR2はモデルの失敗というより“真の地理的汎化の難しさ”として解釈されています。
  • 90%の周辺カバレッジを狙う分割適合予測では、東アフリカでのカバー率不足(実測PICP 65.3% vs. 想定90%)が示され、湿度と衛星PBLHに関するKS統計により中程度の空間的共変量シフトと整合します。
  • 不確実性を運用可能な形に落とし込み、地域ごとの信頼度フラグ(High/Medium/Low/Unreliable)と、未モニタ人口のうち負担が大きい地域へ拡大を誘導するモニタ優先スコアを提示し、SDGsに沿うグリーン産業移行の支援につなげています。

Abstract

アフリカのグリーンな産業化の必須課題は、大気質を監視するための信頼できるインフラを要求している。私たちは、アフリカ29か国における404の観測地点(OpenAQ, 2017-2022)の2,068,901件の記録を用いて学習した、衛星再解析のPM2.5融合システムを提示する。このシステムはLightGBMに、漏洩耐性のある空間的交差検証と、共形予測(conformal prediction)を組み合わせ、予測値と、その地理的適用可能性の限界を定量化する。5分割の「地点グループ化」空間的交差検証の下で、LightGBMはRMSE = 30.83 +/- 5.07 ug/m3、MAE = 14.54 +/- 1.66 ug/m3、R2 = 0.134 +/- 0.023、そしてマクロF1 = 0.336 +/- 0.018を達成する。このR2は、ランダム分割のベンチマーク(>0.90)を大幅に下回るが、モデルの失敗というよりは、真の地理的な汎化の難しさを反映している。周辺カバレッジが90%となるように調整した分割共形予測では、東アフリカでの深刻な劣化が示される(実測PICP = 65.3% 対 公称90%)。これは、中程度の強さの共変量シフト(湿度 KS = 0.2237、sat_pblh KS = 0.2558)と整合的である。私たちは、これらの知見を地域別の信頼性フラグ(High/Medium/Low/Unreliable)と、観測されていない集団のうち負担が最も大きい地域にインフラ拡充を向けるためのモニタ優先スコアによって運用可能にする。これは、アフリカのグリーン産業転換とSDGs 3.9、7.1.2、9、11.6.2、13を直接支援する。