AGCD: 天気予報のためのエージェント指導型クロスモーダルデコーディング

arXiv cs.AI / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

AGCDはデコーディング時に事前情報を注入するフレームワークで、状態条件付きの物理事前知識を気象予報モデルへ注入して自己回帰の安定性と物理的一貫性を向上させる。
多モーダル大規模言語モデル（MLLMs）を用いて多様な気象要素を抽出し、現在の大気状態から先行知識を導出する、複数エージェントによる気象ナレーション・パイプラインを構築する。
本手法は、領域認識の多尺度トークン化を用いたクロスモーダル領域間相互作用デコーディングを導入し、予報モデルのバックボーン・インターフェースを変更することなく視覚的特徴を精緻化する。
WeatherBenchでの実験は、2つの解像度とバックボーンにわたって6時間予報で一貫した改善を示し、初期段階の誤差成長を抑えた厳密な因果性を満たす48時間の自己回帰ロールアウトを含む。

要旨: 正確な天気予報はグリッド単位の回帰以上のものである。気象場の一貫したシノプティック構造と物理的一致性を保持する必要があり、特に自己回帰的ロールアウトの下では、小さな1ステップ誤差が構造的な偏りへと拡大する可能性がある。既存の物理事前知識アプローチは通常、アーキテクチャ、正則化、あるいはNWP結合によってグローバルで一度きりの制約を課し、展開時の状態適応性とサンプル固有の可制御性を限定している。これらのギャップを埋めるために、Agent-Guided Cross-modal Decoding（AGCD）と呼ばれる、デコード時の事前知識の注入をプラグアンドプレイで行うパラダイムを提案します。現在の多変量大気状態から状態条件付きの物理事前知識を導出し、予測子に対して制御可能で再利用可能な方法で注入します。具体的には、マルチエージェントの気象表現パイプラインを設計し、状態条件付きの物理事前知識を生成します。さまざまな気象要素を効果的に抽出するためにマルチモーダル大規模言語モデルを活用します。事前知識を効果的に適用するために、AGCDはさらにクロスモーダル領域相互作用デコーディングを導入します。これは領域認識型のマルチスケールトークン化と、バックボーンのインターフェースを変更することなく、視覚的特徴を洗練させるための効率的な物理事前知識の注入を行います。WeatherBenchでの実験は、2つの解像度（5.625度と1.40625度）および多様なバックボーン（汎用と気象専門化）において、6時間予測で一貫した性能向上を示し、厳密な因果性を持つ48時間自己回帰ロールアウトを含み、初期段階の誤差蓄積を低減し長期的安定性を向上させます。）

半導体FABにLLMを持ち込んだら何が起きるか — ArXiv論文5本を現場目線でぶった斬る

Qiita

エッジコンピューティングとローカル処理への大規模な移行

Dev.to

仕様駆動開発における自己改良エージェント

Dev.to

Week 3: LLMでの構築を始める前に『退屈な』MLを学ぶ理由

Dev.to

三エージェント・プロトコルは移植可能だ。規律は移植不可能だ。

Dev.to

AGCD: 天気予報のためのエージェント指導型クロスモーダルデコーディング

要点

関連記事

半導体FABにLLMを持ち込んだら何が起きるか — ArXiv論文5本を現場目線でぶった斬る

エッジコンピューティングとローカル処理への大規模な移行

仕様駆動開発における自己改良エージェント

Week 3: LLMでの構築を始める前に『退屈な』MLを学ぶ理由

三エージェント・プロトコルは移植可能だ。規律は移植不可能だ。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer