概要: 研究者は一様にサンプルされた数値シミュレーションデータでニューラルシミュレータを訓練します。 しかし同じ予算の下で、体系的にサンプルされたデータは最も効果的な情報を提供するのでしょうか? 根本的で正式には式化されていない問題は、ロールアウトの精度を最大化するために、ニューラルシミュレータの訓練データをどのようにサンプリングすべきかということです。 既存のデータサンプリング手法は、局所的に高い情報密度を持つ領域へ収束しがちであるか、多様性を維持する一方でモデル特異性が不十分で、均一サンプリングと同等以下の性能につながることが多いです。 この課題に対処するため、ニューラルシミュレータに特化したデータサンプリング手法 Gradient-Informed Temporal Sampling(GITS)を提案します。 GITS はパイロットモデルの局所勾配とセットレベルの時間的カバレッジを共同で最適化し、モデルの特異性とダイナミカル情報のバランスを効果的に取ります。 複数のサンプリングベースラインと比較して、GITS が選択したデータは、複数の PDE 系、モデルバックボーン、サンプル比にまたがってロールアウト誤差を低く達成します。 さらに、アブレーション研究は、GITS の2つの最適化目的の必然性と相補性を示しています。 さらに、GITS の成功したサンプリングパターンおよび GITS が失敗する典型的な PDE 系およびモデルバックボーンを分析します。
勾配情報を用いた時系列サンプリングは、PDE代理モデル訓練におけるロールアウト精度を向上させる
arXiv cs.LG / 2026/3/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- Gradient-Informed Temporal Sampling (GITS) を導入し、局所的勾配情報と集合レベルの時系列カバレッジを同時に最大化することで、ニューラルPDEシミュレーターのデータサンプリングを最適化する。
- GITS は、さまざまな PDE 系、モデルのバックボーン、サンプリング比において、複数のサンプリングベースラインと比較してロールアウト誤差を低下させる。
- アブレーション研究は、GITS の両方の最適化目的が性能向上には必要であり、相補的であることを示している。
- 本研究は、GITS が生成するサンプリングパターンを分析し、GITS が失敗し得る状況や PDE モデルの組み合わせについて議論している。


