Ro-SLM:ロボットのタスク計画と操作コード生成のためのオンボード小型言語モデル
arXiv cs.RO / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、クラウド依存や高性能計算資源への依存を避けるため、ロボットのオンボード環境で動作可能な小型言語モデル(SLM)によるタスク計画とコード生成を可能にする枠組み「Ro-SLM」を提案しています。
- Ro-SLMは、LLMを用いたデータセット合成(多様な指示の生成、最小限の人手での正解コード生成、実環境に近いシナリオへの指示拡張)を起点に、SLMを微調整します。
- 学習では、LLMを報酬関数として用いてトレーニングを誘導し、知識・推論能力を蒸留することでオンボードSLMの性能を引き上げます。
- UAVの操作タスクでの実験により、Ro-SLMは当初はロボットのタスク計画・コード生成ができなかったSLMを改善し、LLMに近い性能に到達することを示しています。




