概要: テキストから時系列への生成は、自然言語によって複雑で多尺度な大気力学を直感的に制御できるため、特に気象分野で重要です。既存の手法は、大規模で物理的に裏付けられたマルチモーダルデータセットの欠如、および天候信号のスペクトル・時間構造を見落とすアーキテクチャによって制約されています。私たちは、テキストに導かれた気象時系列生成のための統一的な枠組みにより、これらの課題に取り組みます。まず、専門家レベルのキャプションをMulti-agent Collaborative Captioning(MACC)パイプラインにより構築し、それに対応させた10億規模の気象データセットであるMeteoCap-3Bを導入します。これにより、情報密度が高く、かつ物理的に整合した注釈が得られます。このデータセットに基づき、MTransformerを提案します。MTransformerは拡散ベースのモデルであり、Spectral Prompt Generatorによって、テキスト記述を複数バンドのスペクトル事前情報へと写像することで、周波数を意識した注意(frequency-aware attention)により生成を導き、正確な意味制御を可能にします。実世界のベンチマークに対する大規模な実験により、生成品質の最先端性、正確なクロスモーダル整合、強い意味制御性、さらにデータが乏しい状況およびゼロショット設定における下流の予測での大幅な改善が示されます。加えて、一般的な時系列ベンチマークに関する追加結果から、本提案の枠組みが気象の範囲を超えて汎化することが示されています。
スペクトル認識型テキストから時系列生成:数十億規模のマルチモーダル気象データに基づく
arXiv cs.LG / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、天候信号のスペクトル・時間的構造を考慮した、テキストガイドによる気象時系列生成のための統一的フレームワークを提案する。
- 専門家レベルのキャプションを、マルチエージェントによる協調的キャプショニング・パイプラインで作成することで物理的一貫性を高めた、数十億規模のマルチモーダル気象データセット「MeteoCap-3B」を導入する。
- 提案するMTransformerは拡散ベースのモデルであり、スペクトル・プロンプト生成器と周波数を意識した注意機構を用いて、テキストをマルチバンドのスペクトル事前分布へ写像し、より正確なセマンティック制御を実現する。
- 実験結果では、生成品質の最先端性能、強いモーダル間アラインメント、セマンティック制御性の向上が報告されており、とりわけデータが乏しい状況やゼロショット環境で、下流の予測性能が改善する。
- この手法は、より広範な時系列ベンチマークに対しても汎化できることを示しており、気象分野を超えて適用可能である可能性が示唆される。



