WassersteinGradによる動的な物理場の予測説明:自己回帰型の天候予測への適用

arXiv cs.LG / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、自己回帰型の天候予測のような動的な物理場に対するニューラルネットワーク予測の説明が実運用上の必須要件になっていることを背景に、その説明手法を扱います。
  • 動的な物理場では入力摂動が“振幅の定常的なノイズ”ではなく“幾何学的なアトリビューションのズレ”を生むため、SmoothGradのような点ごとの平均化によって重要特徴がぼやけてしまう失敗モードを示します。
  • これを解決するために、WassersteinGradを提案し、点ごとの平均の代わりにエントロピー正則化付きWassersteinバリセンターで、摂動後アトリビューション間の幾何学的な合意を抽出します。
  • 地域の天候データと気象学者が検証したニューラルモデルによる実験では、WassersteinGradが単発予測および自己回帰予測の両方で勾配ベースのベースラインよりも有望な説明特性を示したと報告しています。

概要: 高リスクな環境に人工知能を統合する需要が増え続ける中で、ニューラルネットワーク予測の背後にある推論を説明することは、単なる理論上の好奇心から、厳密な運用上の要件へと変化しています。本研究は、天気予報のような動的な物理場に対する自己回帰型ニューラル予測の説明に動機づけられています。勾配ベースの特徴量帰属(feature attribution)手法は、特に高次元入力に対してスケーラブルであることから、こうしたデータに対する予測を説明するために広く用いられています。また、SmoothGrad のような勾配ベース手法が、複数のノイズを加えた入力から得られる帰属マップの点ごとの平均を用いて説明を頑健化するという形で、画像分野では現在標準となっている点も注目に値します。本研究の目的は、この集約戦略を動的物理場に対して効率的に適応することです。そのために、私たちは最初の貢献として、動的物理場において摂動を加えた帰属マップを平均する際の、基本的な失敗モードを特定します。すなわち、確率的な入力摂動は、帰属マップに停留的(stationary)な振幅ノイズを引き起こすのではなく、帰属の幾何学的な変位を引き起こします。その結果、点ごとの平均は、空間的に位置がずれたこれらの特徴をぼかしてしまいます。この問題に対処するために、摂動された帰属マップ間の幾何学的な合意(consensus)を抽出する WassersteinGrad を提案します。これは、帰属マップのエントロピー正則化された Wasserstein 重心(barycenter)を計算することで実現します。地域の天気データと、気象学者が検証したニューラルモデルで得られた結果は、単一ステップおよび自己回帰型の予測設定の両方において、勾配ベースのベースラインに対して WassersteinGrad が有望な説明可能性(explainability)特性を示すことを明らかにしています。