Extreme Weather Bench:高影響の気象を評価するためのフレームワークとベンチマーク

arXiv cs.LG / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • Extreme Weather Bench(EWB)は、高影響な気象事象についてAIおよび数値天気予報(NWP)モデルを評価するための、新しいコミュニティ主導のベンチマーク・スイートとして発表されました。
  • 複数の空間・時間スケールにまたがる標準化されたケーススタディと、観測データ、影響ベースの評価指標、オープンソースのコードを提供します。
  • 一般の人々にとって重要なハザードも含めて、モデル同士を一貫した形で比較できるようにすることで、検証・妥当性確認(validation/verification)を強化することを目指しています。
  • EWBは無料のオープンソースで、世界の気象・予報検証コミュニティと協力しながら、新たな現象、テストケース、指標を追加して進化していく予定です。

Abstract

世界中で経験される多様で高いインパクトを持つ気象現象を予測することは、人工知能(AI)および数値気象予測(NWP)モデルの双方にとって課題であり、これらのモデルは導入前に適切に検証されることが極めて重要です。AIの気象モデルは急速に進化していますが、その評価の多くは現在、いずれかの形として大規模なグローバルスケールで行われるか、あるいは少数の事例研究や特定の地域を人手で選び出すことで実施されています。高インパクトな気象に焦点を当てた広く用いられているオープンソースのベンチマーク群は、他のAI分野の場合と同様に、あらゆる規模の気象モデルの科学を前進させるのに役立つでしょう。ここでは、Extreme Weather Bench(EWB)を紹介します。EWBは、新しいコミュニティ主導のベンチマーク群であり、世界中の人々にとって重要な多様な高インパクトのハザードに対して、モデルの検証および確証を容易にします。EWBは、(複数の空間的・時間的スケールにまたがり、気象スペクトルの異なる領域を含む)標準化された一連の事例研究、観測データ、インパクトに基づく指標、そしてユーザが自分のモデルを評価するためのオープンソースコードを提供します。モデルが、標準化された事例研究のセットに対して機能すること、特に一般の人々にとって高いインパクトのある事象に対して機能することを検証することは、AIモデルの信頼性を高めるうえで重要な要素です。EWBは、事例研究を用いることで、モデル間の真の比較を可能にし、特定の高インパクトな現象についてモデルを評価することにより、あらゆる気象モデルに対して科学を前進させることに貢献します。EWBは無料のオープンソースのコミュニティ主導システムであり、世界規模の気象・予報検証コミュニティとの協力のもと、追加の現象、テストケース、指標を含む形で進化し続けます。