AI Navigate

比較観察のための代理モデリングを用いた人間-AI協働の自律的実験

arXiv cs.LG / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • px-BOは、ベイズ最適化における人間とAIの協働ループを導入し、従来の実験と比較して直接的なスカラー目的をその場での人間投票に置換し、Bradley-Terry モデルを介して代理目的へ変換する。
  • 代理モデルは、将来の投票を可能にする AI の代理として機能し、品質を維持しつつ人間の作業負荷を低減する。代理モデルの更新には定期的な人間検証が行われる。
  • 本手法は材料研究における高次元・ノイズの多い物理記述子に対処し、従来のデータ駆動型ベイズ最適化より探索効率を向上させる。
  • シミュレーションデータおよび PTO サンプルから生成された BEPS データを用いて実証され、ドメイン専門家の制御を強化し、材料空間探索を加速する可能性を示す。

概要:
多次元の制御パラメータにわたる、材料表現、合成、そして所望の応用における機能特性を最適化するには、ベイズ最適化(BO)などのアクティブラーニングを用いた迅速な戦略的探索が必要です。
しかし、そのような高次元の実験的物理記述子は複雑でノイズが多く、そこから低次元の数学的スカラー指標や目的関数を導出することは誤りとなる可能性があります。
さらに、従来の純粋にデータ駆動の自律探索では、これらの目的関数が物理記述子の微妙な変動や重要な特徴を見落としがちで、材料系の未知の現象を発見できない可能性があります。
これに対処するため、ここでは人間とAIエージェントがその場で協働することによる代理モデルを用いたベイズ最適化(px-BO)を提案します。
BOのループ上で、実験データから直接数学的な目的関数を定義する代わりに、新しい実験結果を既存の実験と比較し、人間のエージェントが好ましいサンプルを選ぶその場の投票システムを導入します。
これらの人間主導の比較は、Bradley-Terry(BT)モデルへの適合を通じて代理ベースの目的関数へと変換されます。
その後、人的介入を最小化するために、この反復的に訓練された代理モデルは、将来の代替的な人間投票のためのAIエージェントとしても機能します。
最後に、これらの代替投票は定期的に人間エージェントによって検証され、修正はその場で代理モデルに学習されます。
提案された px-BO フレームワークの性能を、PTOサンプルから生成された模擬データおよび BEPS データに対して示しました。
私たちは、本手法が従来のデータ駆動型探索よりも改善された探索を実現するため、領域の専門家のコントロールをより適切に提供し、したがって、加速され意味のある材料空間の探索における人間とAIの協働の重要性を示すことを見出しました。

返却形式: {"translated": "翻訳されたHTML"}