機械学習による軌道自由密度汎関数理論(OF-DFT)に対するサロゲート汎関数

arXiv cs.LG / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は「サロゲート汎関数」として、軌道自由密度汎関数理論(OF-DFT)向けの機械学習エネルギー汎関数を提案し、汎用的な物理参照との忠実性ではなく、固定した密度最適化手順を適用した後に真の基底状態密度が得られることを要件としています。
  • 学習には基底状態の密度のみが必要であり、基底状態から外れた領域でのエネルギーや勾配といったラベルを要しないとしています。
  • 勾配降下の改善に基づく損失関数を導入し、最適化された密度が基底状態へ指数関数的に収束することを保証します。
  • さらに推論時に実際に辿られる最適化軌道の近傍に学習を集中させる適応的サンプリング手法を組み合わせ、学習効率を高めています。
  • QM9およびQMugsのベンチマークでは、密度誤差が既存の完全教師ありの機械学習OF-DFTと同等以上である一方、従来必要だったO(N^3)の直交化(正規化)ステップを不要にし、大規模系での計算時間スケーリングを改善します。

Abstract

本稿では、サロゲート汎関数を導入します。サロゲート汎関数とは、軌道自由密度汎関数理論(OF-DFT)のための機械学習されたエネルギー汎関数であり、物理的参照に対する普遍的な忠実度によって定義されるのではなく、固定した手順による密度最適化が真の基底状態密度を与えることを要求するだけで定義されます。ありがたいことに、サロゲート汎関数の学習には、基底状態から外れた領域でのエネルギーや勾配は不要で、基底状態密度のみを用いればよいです。ここでは、密度が基底状態へ指数関数的に収束することを保証する勾配降下による改善損失を提案し、推論時に実際に訪れる最適化経路の周辺へ学習を集中させる適応的サンプリング手法と組み合わせます。QM9およびQMugsベンチマークにおいて、サロゲート汎関数は、完全に教師ありで学習された機械学習OF-DFTの最先端と競争力のある、あるいはそれを上回る密度誤差を達成します。さらに、従来研究で必要とされていたO(N^3)の直交正規化ステップを不要にすることで、大規模系に対する計算時間スケーリングが改善されます。