Ro-SLM：ロボットのタスク計画と操作コード生成のためのオンボード小型言語モデル

arXiv cs.RO / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、クラウド依存や高性能計算資源への依存を避けるため、ロボットのオンボード環境で動作可能な小型言語モデル（SLM）によるタスク計画とコード生成を可能にする枠組み「Ro-SLM」を提案しています。
Ro-SLMは、LLMを用いたデータセット合成（多様な指示の生成、最小限の人手での正解コード生成、実環境に近いシナリオへの指示拡張）を起点に、SLMを微調整します。
学習では、LLMを報酬関数として用いてトレーニングを誘導し、知識・推論能力を蒸留することでオンボードSLMの性能を引き上げます。
UAVの操作タスクでの実験により、Ro-SLMは当初はロボットのタスク計画・コード生成ができなかったSLMを改善し、LLMに近い性能に到達することを示しています。