AutoSurrogate:地下流動のための深層学習サロゲートモデルを自律的に構築するLLM駆動のマルチエージェントフレームワーク

arXiv cs.AI / 2026/4/15

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • AutoSurrogateは、計算コストの高い地下流動シミュレーションのために、自然言語による指示を用いることで、ドメイン科学者が高品質な深層学習サロゲートモデルを構築できるようにする、LLM駆動のマルチエージェントフレームワークである。専門的なMLの知識は不要。
  • このシステムは、データのプロファイリング、モデル・ズーからのアーキテクチャ選択、ベイズ流のハイパーパラメータ最適化の実行、モデルの学習、ユーザーが定義したしきい値に基づく品質評価を含む、サロゲート構築のエンドツーエンドのタスクを複数の専門エージェントが担当する。
  • 数値的不安定性が発生した場合には設定を調整して訓練を再起動することで、また目標精度を満たさない場合にはアーキテクチャを差し替えることで、よくある失敗モードに自律的に対処する。
  • 3D地質炭素貯留のモデリング事例(31タイムステップにわたる圧力およびCO2飽和度の予測)では、AutoSurrogateが単一の自然言語文から、最小限の人手介入でデプロイ可能なサロゲートを生成できる。
  • 報告された結果は、AutoSurrogateが、手動チューニングなしで、専門家が設計したベースラインおよびドメイン非依存のAutoMLの両方を上回る性能を示しており、実運用への強い可能性があることを示している。

要旨: 地下の流れの高精度な数値シミュレーションは計算コストが高く、特に不確実性定量化やデータ同化のような多問い合わせ(many-query)タスクでは負担が大きい。深層学習(DL)のサロゲートは順解析(forward simulation)を大幅に高速化できるが、その構築には、アーキテクチャ設計からハイパーパラメータ調整まで含む相当量の機械学習(ML)に関する専門知識が必要であり、多くの分野の研究者にはそれがない。さらに、このプロセスは主として手作業であり、ヒューリスティックな選択に大きく依存している。この専門知識のギャップは、DLサロゲート技術のより広範な導入における主要な障壁である。そのため本研究では、自然言語による指示を通じて、MLの専門知識がない実務者が地下の流れの問題に対して高品質なサロゲートを構築できるようにする、大規模言語モデル駆動のマルチエージェントフレームワーク AutoSurrogate を提案する。シミュレーションデータと任意の嗜好(preferences)を与えると、4つの専門エージェントが協働して、データプロファイリング、モデル・ズー(model zoo)からのアーキテクチャ選択、ベイズ的ハイパーパラメータ最適化、モデル学習、ユーザが指定した閾値に対する品質評価を実行する。システムはまた、数値的不安定が発生した場合に設定を調整して学習をやり直すことや、予測精度が目標に届かなかった場合に別のアーキテクチャへ切り替えることといった、一般的な失敗モードも自律的に処理する。本環境では、途中のいかなる段階においても人手の介入を最小限にしつつ、配備(deployment)可能なサロゲートモデルを生成するのに、単一の自然言語文だけで十分であり得ることを示す。3Dの地質学的炭素貯留(carbon storage)モデリング課題に対して AutoSurrogate の有用性を実証する。具体的には、透水係数場を31タイムステップにわたる圧力およびCO_2飽和度場へマッピングする。手動でのチューニングを一切行わずに、AutoSurrogate は、専門家が設計したベースラインおよび分野非依存の AutoML 手法を上回ることができ、実運用への有望な可能性を示す。