要旨: 正確な天気予報はグリッド単位の回帰以上のものである。気象場の一貫したシノプティック構造と物理的一致性を保持する必要があり、特に自己回帰的ロールアウトの下では、小さな1ステップ誤差が構造的な偏りへと拡大する可能性がある。既存の物理事前知識アプローチは通常、アーキテクチャ、正則化、あるいはNWP結合によってグローバルで一度きりの制約を課し、展開時の状態適応性とサンプル固有の可制御性を限定している。これらのギャップを埋めるために、Agent-Guided Cross-modal Decoding(AGCD)と呼ばれる、デコード時の事前知識の注入をプラグアンドプレイで行うパラダイムを提案します。現在の多変量大気状態から状態条件付きの物理事前知識を導出し、予測子に対して制御可能で再利用可能な方法で注入します。具体的には、マルチエージェントの気象表現パイプラインを設計し、状態条件付きの物理事前知識を生成します。さまざまな気象要素を効果的に抽出するためにマルチモーダル大規模言語モデルを活用します。事前知識を効果的に適用するために、AGCDはさらにクロスモーダル領域相互作用デコーディングを導入します。これは領域認識型のマルチスケールトークン化と、バックボーンのインターフェースを変更することなく、視覚的特徴を洗練させるための効率的な物理事前知識の注入を行います。WeatherBenchでの実験は、2つの解像度(5.625度と1.40625度)および多様なバックボーン(汎用と気象専門化)において、6時間予測で一貫した性能向上を示し、厳密な因果性を持つ48時間自己回帰ロールアウトを含み、初期段階の誤差蓄積を低減し長期的安定性を向上させます。)
AGCD: 天気予報のためのエージェント指導型クロスモーダルデコーディング
arXiv cs.AI / 2026/3/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- AGCDはデコーディング時に事前情報を注入するフレームワークで、状態条件付きの物理事前知識を気象予報モデルへ注入して自己回帰の安定性と物理的一貫性を向上させる。
- 多モーダル大規模言語モデル(MLLMs)を用いて多様な気象要素を抽出し、現在の大気状態から先行知識を導出する、複数エージェントによる気象ナレーション・パイプラインを構築する。
- 本手法は、領域認識の多尺度トークン化を用いたクロスモーダル領域間相互作用デコーディングを導入し、予報モデルのバックボーン・インターフェースを変更することなく視覚的特徴を精緻化する。
- WeatherBenchでの実験は、2つの解像度とバックボーンにわたって6時間予報で一貫した改善を示し、初期段階の誤差成長を抑えた厳密な因果性を満たす48時間の自己回帰ロールアウトを含む。