能動的知覚によるロボット計画と状況対応

arXiv cs.RO / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • この論文は、実世界では環境が動的であるため実行中に「想定外の問題」(例:ドアの詰まりや床の落下物)が頻繁に起こり、ロボットの長期自律が難しくなると指摘しています。
  • 計画実行中に想定外の状況へ対応できるよう、能動的知覚と計画を統合した「VAP-TAMP」という枠組みを提案しています。
  • VAP-TAMPは、行動に関する知識を手がかりに、視点選択と状況評価のために視覚言語モデルへ戦略的に問い合わせます。
  • さらに、シーン・グラフを構築して推論することで、タスクレベルの判断と運動計画を統合し、自身の失敗や外部からの撹乱の双方に対応します。
  • シミュレーションとモバイルマニピュレーション・プラットフォーム上で、サービス系タスクを用いた評価を行っています。

Abstract

現在のロボットは、複雑なタスクを達成するための計画を計算することが可能です。しかし、現実世界の環境は本質的に開放的かつ動的であり、計画の実行中には、ドアのジャムや床に落ちた物体のような、想定外の状況がしばしば発生します。これらの状況は、ロボット自身の行動の失敗に起因する場合もあれば、人間の活動のような外部からの攪乱に起因する場合もあります。このような実行—時間(execution - time)状況を検出し、対処することは依然として大きな課題であり、それがロボットの長期的自律性の実現を制限しています。本論文では、計画と状況処理のための枠組みであるVAP-TAMPを開発し、計画の実行中にロボットが想定外の状況を能動的に認識し、対処できるようにします。VAP-TAMPは、行動知識を活用して、能動的な視点(ビュー)の選択と状況評価のために視覚—言語モデルを戦略的に促し、さらに、統合されたタスク計画と運動計画のためにシーングラフを構築し推論します。VAP-TAMPは、シミュレーションにおけるサービスタスクと、モバイルマニピュレーション・プラットフォーム上で評価しました。