状態空間の拡大とハイブリッド行動領域を用いたPOMDPベースの物体探索
arXiv cs.RO / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- この論文は、3D環境におけるハイブリッド(連続+離散)行動と、状態空間が拡大していく高次元POMDPとして、雑然とした屋内空間でのモバイルロボットによる物体探索を扱います。
- 新しいオンラインPOMDPソルバとしてGNPF-kCTを提案しており、知覚モジュール、状態(belief)ツリーの再利用を伴うMCTS、役に立たない原始行動の除外を行うニューラルプロセス、そして大規模な行動空間を扱うためのk-center(超球面)離散化を組み合わせています。
- 推定される直径を持つセル内での信念差と行動価値関数に基づく修正UCBにより、MCTSの探索拡張を効率的に導きます。
- 情報や報酬が限られる状況では、グリッドワールドモデルを用いた「推定ターゲット物体」戦略により、探索効率を高めます。
- Gazebo上の実験(FetchとStretch)およびオフィス環境での実機テストで、計算資源と知覚システムが同程度の条件下において、POMDPベースのベースラインや非POMDPの最先端ソルバ(LLMベースの手法を含む)よりも、ターゲットの特定がより速く、より確実であることが示されています。



