要旨:開放語彙モバイル操作における近年の進展により、ロボットが実際の家庭環境に導入されつつある。こうした状況では、オープンセットの物体参照や頻繁な外乱のもとで、長時間にわたる信頼性の高い実行が不可欠となる。しかし、多くの失敗がなお残っている。これらの失敗は意味の誤解によって引き起こされるのではなく、象徴的な計画と、変化し続ける物理世界との不整合に起因しており、次の3つの反復的な制限として現れる: (i) 既存のシステムはしばしば事前にスキャンした意味マップに依存しており、シーンの変化や外乱後に不整合が生じる; (ii) 下流の操作の実行可能性を考慮せずにナビゲーションの到達地点を選択するため、「到着したが操作できない」という問題が起きる; (iii) 異常への対処を区別のないグローバルな再計画で行いがちで、局所的な誤りを封じ込められないことが多い。実行の不整合に対処するため、本研究では、実行中に検証可能な物理状態と象徴的推論を整合させる、物理に基づいたクローズドループ枠組みANCHORを提案する。ANCHORは3つのメカニズムを統合する: (i) 物理的に固定されたタスク計画により、象徴的述語を観測可能な幾何学的アンカーに結び付け、各行動の後に再検証する; (ii) 操作可能性を意識したベースのアライメントにより、ナビゲーションの到達地点が運動学的到達可能性および局所的な衝突の実行可能性を満たすことを保証する; (iii) 最小責任層(minimum-responsible-layer)による階層的回復により、知覚・ベースアーム協調・実行という層にまたがる失敗を局所化し、連鎖的な再試行を防ぐ。これまでに見たことのない環境での実機ロボット60回の試行において、ANCHORはタスク成功率を53.3%から71.7%に改善し、外乱下での回復率71.4%を達成した。これは、明示的な物理的な根拠付けと、構造化された失敗の封じ込めが、頑健なモバイル操作にとって重要であることを示している。プロジェクトページは https://anchor9178.github.io/ANCHOR/ で利用できる。
ANCHOR:堅牢なホームサービス向けモバイルマニピュレーションのための、物理的根拠に基づくクローズドループ手法
arXiv cs.RO / 2026/4/29
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 本論文は、オープンボキャブラリのモバイルマニピュレーションにおける継続的な失敗要因が、意味の誤解ではなく、変化し続ける物理環境とシンボリック計画の間に生じる「実行上の不整合」である点を示します。
- ANCHORは、実行中にシンボリック推論を検証可能な物理状態へ再整合させる「物理的に根拠づけたクローズドループ」枠組みであり、タスク計画の再妥当化、操作可能性を考慮したベース姿勢合わせ、失敗の局所化を行う階層的リカバリを統合します。
- タスク計画では、シンボリックな述語を観測可能な幾何学アンカーに結び付け、各アクション後に再チェックすることで、シーン変更や外乱によるズレを抑えます。
- これまで見たことのない環境での実ロボット60試行において、ANCHORはタスク成功率を53.3%から71.7%へ向上させ、摂動下での回復率も71.4%を達成しました。
- 失敗を知覚・ベースとアームの協調・実行の各層で局所化し、グローバルな作り直し(再計画)による連鎖的なリトライを防ぐことの重要性を強調しています。



