AI Navigate

データ駆動型統合カーネルによる解釈可能な非局所演算子学習

arXiv cs.LG / 2026/3/12

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、非局所情報の集約と局所的非線形予測を明示的に分離することで、非局所演算子学習に構造を付与するデータ駆動型統合カーネルを提案する。
  • 時空予測場は、水平空間、高さ、および時間にわたり学習可能なカーネルを用いて最初に統合され、その後、得られた特徴にのみ局所的な非線形写像を適用する。
  • この設計は非線形相互作用を統合された特徴のごく少数の集合に限定し、各カーネルを予測に最も寄与する水平位置、垂直レベル、および過去のタイムステップを示す重み付けパターンとして直接解釈可能にする。
  • 南アジアのモンスーン降水量を対象として、階層的なニューラルネットワークモデル(ベースライン、ノンパラメトリック・カーネル、パラメトリック・カーネルモデルを含む)でフレームワークを実証する。
  • この階層全体を通じて、カーネルベースのモデルは学習可能パラメータをはるかに少なくしつつほぼベースラインの性能を達成しており、適切な構造的制約が課される場合、関連する非局所情報の多くは解釈可能な統合の小さな集合で捉えられることを示している。
機械学習モデルは水平空間・高度・時間において非局所的な気候プロセスを表現できることがあり、これらの次元を横断して情報を結合することでしばしば高度に非線形な方法で表される。これにより予測精度が向上する一方で、学習された関係は解釈が難しく、非局所情報の範囲が拡大すると過剰適合のリスクが高まる。私たちはこの課題に対処するため、データ駆動型統合カーネルを導入する。これは非局所情報の集合を局所的な非線形予測から明示的に分離することで、非局所演算子学習に構造を付与するフレームワークである。各時空予測場は水平空間・高度・時間にわたる連続的な重み付け関数として定義される学習可能なカーネルを用いて最初に統合され、その後、得られたカーネル統合特徴および任意の局所入力のみに対して局所的な非線形写像を適用する。この設計は非線形相互作用を統合された特徴のごく少数に限定し、各カーネルを予測に最も寄与する水平位置・垂直レベル・過去のタイムステップを示す重み付けパターンとして直接解釈可能にする。我々は、構造を増した階層的なニューラルネットワークモデルの階層を用いて南アジアのモンスーン降水量に対してこのフレームワークを実証する。ベースライン・ノンパラメトリック・カーネル・パラメトリック・カーネルのモデルを含む階層を通じて、カーネルベースのモデルははるかに少ない学習可能パラメータでほぼベースラインの性能を達成し、適切な構造的制約が課される場合には、関連する多くの非局所情報が解釈可能な統合の小さな集合で捉えられることを示している。