ラベルなしデータから相互作用粒子系を学習する

arXiv stat.ML / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、観測が離散時刻で得られる一方で、データ収集やプライバシー上の制約により軌跡（トラジェクトリ）が欠落している状況で、相互作用粒子系の相互作用ポテンシャルを学習することに取り組む。
粒子分布の経験分布に関する弱形式の確率的進化方程式から導出した、軌跡を要しない自己テストの損失関数を提案し、ラベル付きの軌跡を必要とせずにポテンシャルを推定する。
損失はポテンシャルに関して二次形式であるため、ビッグデータのレジームを用いて大規模・高次元の系にスケール可能な、パラメトリックおよびノンパラメトリック回帰の両アプローチが可能となる。
数値テストを用いた実験により、本手法は、ラベル対応によってまず軌跡を復元するベースラインよりも優れた性能を示すことが確認されており、観測時刻の刻み幅が大きい場合でも同様である。
著者らは、サンプルサイズが増加するにつれてパラメトリック推定量が収束することを証明する理論結果を提示し、推定手法の形式的な基盤を与えている。

Abstract

相互作用する粒子系のポテンシャルを学習することは、さまざまな科学分野に共通する基礎的な課題である。大きな障害は、離散的な時点で収集されたラベルなしデータが、データ収集手法の制限やプライバシー制約のために軌跡情報を欠いている点である。我々は、経験分布の弱形式の確率的進化方程式を活用する、軌跡不要の自己テスト損失関数を導入することで、この課題に取り組む。この損失関数はポテンシャルに関して二次であり、大規模で高次元のシステムにおいてビッグデータにスケールする、頑健な推定のためのパラメトリックおよびノンパラメトリック回帰アルゴリズムを支える。体系的な数値実験により、本手法が、ラベル同定によって復元された軌跡に回帰するベースライン手法を上回り、大きな観測時間ステップにも耐えることを示す。さらに、サンプルサイズが増加するにつれてパラメトリック推定量が収束することを確立し、提案手法の理論的基盤を与える。