要約:深層生成モデルに基づく学習済み事前分布は地震反演のデータ駆動の正則化を提供しますが、それらを訓練するには代表的な地下地層モデルのデータセットが必要です。これは地球科学の応用において本質的に希少な資源です。
ほとんどの生成モデルの訓練目的は有限データセット上の最大尤度として表現できるため、いずれのモデルも経験的分布へ収束するリスクがあり、基礎となる地質分布を学習するのではなく訓練例を暗記してしまう可能性があります。私たちは、そのような暗記型の事前分布の下での事後分布が再重み付けされた経験分布へと縮約されることを示します。すなわち、格納された訓練例の中から尤度で重み付けして検索するものです。拡散モデルに特化すると、暗記は閉形式のガウス混合事前分布を生み出し、各訓練例の周りで前方演算子を線形化することにより、局所ジャコビアンによって幅とシフトが決まる成分を持つガウス混合事後分布が得られます。これらの予測を簡略化された逆問題で検証し、全波形反演のための拡散後方分布サンプリングを通じた暗記の影響を示します。
地球物理学的逆問題における学習済み事前分布の記憶化の役割
arXiv stat.ML / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、地震反演のために限られた地球物理データで訓練された学習済み事前分布における記憶化のリスクを分析する。
- 記憶化された事前分布のもとでの事後分布は、再重み付けされた経験分布のように振る舞い、実質的には訓練データの例を尤度で重み付けして参照する形になることを示している。
- 拡散モデルでは、記憶化はガウス混合型の事前分布を生み出し、訓練例の周りで前方演算子を線形化すると、局所的なヤコビアンに支配された幅とシフトを持つガウス混合後方分布が得られる。
- 著者らは、単純化された逆問題上でこれらの予測を検証し、全波形反演のための拡散後方分布サンプリングを通じて実践的な影響を示している。
- これらの結果は、地球物理学におけるデータ駆動型事前分布の使用時に潜在する記憶化の影響を浮き彫りにし、データが限られる状況でこのようなモデルを訓練・適用する際には慎重さを要することを示唆している。




