アクティブなマルチターゲット追跡のためのベイズ的エキスパート選択を伴う拡散ポリシー
arXiv cs.RO / 2026/4/7
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、拡散ポリシーによる行動生成と、複数のエキスパート戦略を不確実性を意識して選択する仕組みを組み合わせることで、移動ロボットによるアクティブなマルチターゲット追跡を扱う。
- エキスパート選択をオフラインの文脈付きバンディット問題として定式化し、ロボットの現在の信念状態(belief state)から各エキスパートの期待される追跡性能を推定するベイズ的枠組みを導入する。
- マルチヘッドの変分ベイズ最終層(VBLL)モデルにより、各候補戦略の性能についての点推定と予測不確実性の両方を提供する。
- オフラインの「悲観(pessimism)」原理を用い、最も良い最悪ケースの予測性能となるエキスパートを選ぶために、下側信頼限界(LCB)基準を適用する。これにより、信頼できない戦略推定に基づいて行動するリスクを低減する。
- シミュレーション環境での屋内マルチターゲット追跡実験では、基礎となる拡散ポリシーやMixture-of-Expertsのような標準的なエキスパート・ゲーティング手法に比べて性能が向上することを示す。




