要旨: 機械学習エミュレータは、大気状態の予測において驚くべき能力を示してきており、その地球規模の海洋ダイナミクスへの応用も同様の期待が持てます。ここでは、規定された大気条件によって駆動される中期予測のために、GraphCast アーキテクチャを専用の海洋のみのエミュレータへと適応します。このエミュレータは、NOAA の UFS-Replay データセットで訓練されます。24 時間の時間ステップ、単一の初期条件を用い、また自己回帰的な訓練を行わないことで、10〜15 日先のリードタイムに対して熟練した予測を提供するエミュレータを作成します。さらに、ターゲット変数の傾向(tendencies)間の相関を明示的に考慮することで、平均二乗誤差(Mean Squared Error)損失と比べて予測スキルを向上させる損失として、マハラノビス距離(Mahalanobis distance)を用いることを示します。予測された場に対する空間相関解析を通じて、提案する相関を考慮した損失が、地球規模の海洋における遅い相関ダイナミクスに対する統計—動力学的正則化として働き、データ同化のような下流タスクに対してより良いバックグラウンド予測を提供することも示します。
相関を考慮した損失関数が果たす役割と、熟練したグローバル海洋エミュレーション
arXiv cs.AI / 2026/4/22
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究はGraphCastを海洋専用の機械学習エミュレータに適応し、指定された大気条件を用いて中期の全球海洋ダイナミクスを予測します。
- NOAAのUFS-Replayデータセットで学習し、24時間ステップ・単一初期条件・非自己回帰の学習設定により、10〜15日先までの予測に対して高い技能(skill)を示します。
- 変数の「傾向(tendencies)」間の相関を明示的に扱うことで、相関を考慮したマハラノビス距離に基づく損失が平均二乗誤差(MSE)よりも予測精度を改善することを示します。
- 予測場の空間相関分析から、この相関を考慮した損失が、遅く相関の強い海洋ダイナミクスに対する統計・力学的正則化として働き、データ同化のような下流タスクでより良い背景予報に寄与すると結論づけています。