AI Navigate

IROSA: 自然言語による対話的ロボット技能適応

arXiv cs.CL / 2026/3/16

💬 オピニオンTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • 本論文は、言語モデルとロボットハードウェアの間に保護的な抽象化層を設けたツールベースのアーキテクチャを用いる、オープンボキャブラリ対応のスキル適応のフレームワークIROSAを提案する。
  • 事前学習済みの大規模言語モデルを用いて、微調整やモデルとロボット間の直接的な相互作用を必要とせず、特定のツールを選択・パラメータ設定してロボット技能を適応させる。
  • この手法は、7自由度のトルク制御ロボットが産業用ベアリングリングの挿入タスクを実行するデモで実証され、速度、軌道の調整、障害物回避といった自然言語コマンドを可能にする一方、安全性と解釈性を強調する。
  • 本研究は、基盤モデルと模倣学習を統合することで実践的な産業導入を目指し、安全性・透明性・導入性といった課題に対処する。

要旨: 基盤モデルは、多様な領域で印象的な能力を示しており、一方、模倣学習は限られたデータからロボットの技能適応を実現する原則的な方法を提供します。これらのアプローチを組み合わせることはロボティクスへの直接的な応用に大きな可能性をもたらしますが、この組み合わせにはまだ十分な注目が集まっておらず、特に産業用途での展開には限界があります。私たちは、ツールベースのアーキテクチャを通じてオープンボキャブラリのスキル適応を実現する新しいフレームワークを提示します。言語モデルとロボットハードウェアの間に保護的な抽象レイヤを維持します。私たちのアプローチは、事前学習済みのLLMsを活用してロボット技能を適応させるための特定のツールを選択し、パラメータ化します。微調整を必要とせず、直接のモデルとロボット間の相互作用も不要です。 本フレームワークを、産業用途のベアリングリング挿入タスクを実行する7自由度のトルク制御ロボットでデモンストレーションし、速度調整、軌道補正、障害物回避の自然言語コマンドによるスキル適応が成功することを示し、安全性・透明性・解釈可能性を維持します。