ロボットによる物体検出と把持タスクにおけるヒトロボット協調のためのマルチモーダル知覚・言語グラウンディング・制御のアブレーション研究
arXiv cs.RO / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、マルチモーダルなヒトロボット協調システムについて、エンドツーエンド性能に大きく影響する3つのモジュール(行動抽出のためのLLM、視覚的グラウンディングのための知覚系、実行のためのモーションコントローラ)に焦点を当てた制御されたアブレーション研究を示します。
- パイプライン全体を作り直すのではなく、共通の実験プロトコルのもとで各コンポーネントの寄与を切り分け、そのうえで有望な組み合わせをエンドツーエンドで評価します。
- 言語モデルを3種類、知覚構成を5種類、コントローラを3種類比較し、さらに最良候補に対して第2段階の要因計画(ファクトリアル)実験を行います。
- 分析の目的は、どの設計選択が主に実行時間に効くのか、主に成功率に効くのかを明らかにし、将来の改良で最大の工学的改善が見込める箇所を特定することです。




