Distill-Belief:物理場におけるクローズドループ逆ソースの位置推定と特性推定
arXiv cs.AI / 2026/4/30
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- クローズドループ逆ソース位置推定・特性推定(ISLC)では、移動エージェントが限られた時間制約のもとで、ソースを局在化し潜在的な場パラメータを推定するための測定を選ぶ必要があります。
- 主要な課題は、妥当な不確実性推定には高コストなベイズ推論が必要である一方、学習した高速な信念モデルを使うと、近似誤差を突くことで報酬を稼ぐ「リワードハッキング」が起き得る点です。
- 本論文は Distill-Belief を提案し、ベイズで正しい粒子フィルタ教師が事後分布と密な情報獲得(information-gain)信号を供給し、コンパクトな学生が事後を信念統計として蒸留するとともに停止判断用の不確実性証明(uncertainty certificate)を得る仕組みを示しています。
- 配備時には学生モデルのみを使用するため、実行時に高価なベイズ推論へ依存せず、1ステップあたりの計算コストを一定にできます。
- 7つの場モダリティと2つのストレステストでの実験により、ベースラインよりもセンシングコストを削減し、成功率、事後収束(posterior contraction)、推定精度が向上し、リワードハッキングも抑制されることが示されました。
