Ro-SLM:ロボットのタスク計画と操作コード生成のためのオンボード小型言語モデル

arXiv cs.RO / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、クラウド依存や高性能計算資源への依存を避けるため、ロボットのオンボード環境で動作可能な小型言語モデル(SLM)によるタスク計画とコード生成を可能にする枠組み「Ro-SLM」を提案しています。
  • Ro-SLMは、LLMを用いたデータセット合成(多様な指示の生成、最小限の人手での正解コード生成、実環境に近いシナリオへの指示拡張)を起点に、SLMを微調整します。
  • 学習では、LLMを報酬関数として用いてトレーニングを誘導し、知識・推論能力を蒸留することでオンボードSLMの性能を引き上げます。
  • UAVの操作タスクでの実験により、Ro-SLMは当初はロボットのタスク計画・コード生成ができなかったSLMを改善し、LLMに近い性能に到達することを示しています。