概要: 本論文は、人間同士の自然なやり取りに着想を得た、ロボットの直感的なエンドユーザープログラミングのための新しい概念を提示する。自然言語と補助的ジェスチャーを、大規模言語モデル(LLM)およびコンピュータビジョン(CV)を用いてロボットのプログラムへと変換する。明確化のための質問や視覚的な表現という、同様に自然なシステムのフィードバックによって生成されたプログラムを見直し、調整することが可能となり、それにより安全性、透明性、およびユーザの受容性が保証される。
直感的なロボットプログラミングと認知ロボティクスによる手作業タスクの自動化
arXiv cs.RO / 2026/4/8
💬 オピニオン
要点
- 本論文は、LLMとコンピュータビジョンを用いて、自然言語と人のジェスチャーをロボットが実行可能なプログラムへと対応付けることで、エンドユーザーが直感的にロボットをプログラムできる方法を提案する。