MAGPI:乏しいデータからサロゲートモデリングを行うためのマルチフィデリティ拡張ガウス過程入力

arXiv stat.ML / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、高忠実度の学習データが乏しい場合に高精度なサロゲートモデルを構築することを目的とした、MAGPIというマルチフィデリティ拡張ガウス過程回帰手法を提案する。
  • 利用可能な低忠実度モデルを活用して追加の低忠実度データを生成し、そのデータを用いて特徴量の拡張(feature augmentation)を行うことで、ガウス過程に対する有効な入力空間を拡張する。
  • MAGPIは、既存のマルチフィデリティGPR手法、特にコクライジング(cokriging)と自己回帰型推定器(autoregressive estimators)の強みを組み合わせるよう設計されている。
  • 複数のベンチマーク試験問題に対する実験により、最先端手法と比べて予測精度の向上と計算コストの低減が示される。

Abstract

教師あり機械学習とは、パラメータ化されたモデルを、ラベル付きの入出力データに適合させる実践を指します。教師あり機械学習の手法は、高価な高忠実度(high-fidelity)モデルを(部分的に)置き換えうる、効率的なサロゲートモデルを学習できる可能性を示しており、最適化、不確実性の定量化、推論といった多要求解析(many-query analyses)を実行可能にします。しかし、学習データを高価なモデルや実験の評価によって得る必要がある場合、取得できる学習データ量がしばしば限られるため、学習済みサロゲートモデルが信頼できなくなることがあります。それでも、多くの工学および科学の場面では、より安価な \\emph{低忠実度(low-fidelity)} モデルが利用可能な場合があります。たとえば、簡略化した物理モデリングや粗い格子(coarse grids)から生じることがあります。これらのモデルを用いて、追加の低忠実度の学習データを生成できます。 \\emph{多忠実度(multifidelity)} 機械学習の目標は、高忠実度データと低忠実度データの両方を用いて、高忠実度モデルよりも評価が安価で、かつ利用可能な任意の低忠実度モデルよりも高い精度を持つサロゲートモデルを学習することです。本研究では、ガウス過程回帰(Gaussian process regression)のための新しい多忠実度学習手法を提案します。この手法は、低忠実度データを用いて、学習済みモデルの入力空間を拡張する追加の特徴量を定義します。提案手法は、既存の多忠実度GPRアプローチの2つの別系統、コクリギング(cokriging)と自己回帰型推定器(autoregressive estimators)から、それぞれ望ましい性質を統合します。複数のテスト問題に対する数値実験により、最先端(state of the art)に比べて予測精度の向上と計算コストの削減の両方が示されます。