ニューラル演算子デジタルツインにおける敵対的脆弱性:原子力熱流動サロゲートに対する勾配不要の攻撃

arXiv cs.LG / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究では、原子力熱流動に対するニューラル演算子ベースのデジタルツインが、境界条件に対する非常に疎で物理的に妥当な摂動によって、破局的な予測誤差を引き起こされ得ることを明らかにした。
  • 4つのニューラル演算子アーキテクチャに対して勾配不要の敵対的探索(微分進化)を行うことで、相対L2誤差が約1.5%から37〜63%へ増大する一方、通常の検証およびzスコアの異常検知では検出されない。
  • 論文は「感度が高いほど単純に悪い」というだけでは脆弱性を説明できないことを示し、有効摂動次元(d_eff)と、感度の集中および増幅を組み合わせた2因子の脆弱性モデルを提案する。
  • 極端な感度集中(例:POD-DeepONet、d_eff≈1)を持つアーキテクチャは、必ずしも最も悪用しやすいわけではない。一方、適度な集中と十分な増幅を伴う場合(例:S-DeepONet、d_eff≈4)に、最も高い攻撃成功が得られる。
  • 著者らは、これらの結果が演算子学習における構造的な攻撃面の存在を示しており、安全性が重要な設定での導入には従来の検証を超えた頑健性保証が必要であることを示唆する。

要旨: オペレータ学習モデルは、原子力およびエネルギーシステム向けのデジタルツインにおける予測の中核として急速に台頭しており、疎なセンサ計測からリアルタイムに場を再構成できることが期待されています。しかし、敵対的擾乱に対する頑健性は未だ特性が明らかにされておらず、安全性が極めて重要なシステムへの導入にとって重要な欠落となっています。本研究では、境界条件への感度を悪用する、極めて疎な(入力の1%未満)かつ物理的にもっともらしい擾乱に対して、ニューラルオペレータがきわめて脆弱であることを示します。4つのオペレータ・アーキテクチャに対して勾配なしの微分進化を用いることで、最小限の修正が壊滅的な予測失敗を引き起こし、相対 L_2 誤差が(検証精度で)約1.5%から37-63%へと増大する一方で、標準的な検証指標ではまったく検知できないことを実証します。注目すべき点として、単一点攻撃の成功例の100%が、z-scoreの異常検知を通過します。我々は、ヤコビアンに基づく診断である有効擾乱次元 d_{\text{eff}} を導入します。これは、感度の大きさと併せて2要因の脆弱性モデルを与え、なぜ極端な感度集中(POD-DeepONet, d_{\text{eff}} \approx 1)を持つアーキテクチャが必ずしも最も悪用されやすいわけではないのかを説明します。すなわち、低ランクの出力射影が最大誤差を抑えるためです。一方で、適度な集中に十分な増幅が加わる場合(S-DeepONet, d_{\text{eff}} \approx 4)には、攻撃成功率が最も高くなります。勾配なし探索は、勾配経路に病理があるアーキテクチャでは勾配ベースの代替(PGD)よりも優れています。また、同じ大きさのランダム擾乱ではほぼゼロの成功率となり、発見された脆弱性が構造的なものであることが確認されます。これらの知見は、オペレータ学習モデルにおいてこれまで見落とされていた攻撃面を明らかにし、導入前には標準的な検証を超えた頑健性保証がこれらのモデルに必要であることを示します。