文法制約付き大規模言語モデルによる精密なロボット指令理解

arXiv cs.RO / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、産業における人とロボットの協働(human-robot collaboration)に向けて、人間の指示を決定論的でロボットが実行可能なコマンド構造へ翻訳するための、文法制約付きハイブリッド大規模言語モデルを提案する。
  • 2段階のパイプラインを用い、微調整したLLMが文脈に基づく推論とパラメータ推定を行い、その後に構造化言語モデルと文法ベースのカノニカライザが出力を標準化された記号的アクションフレームへ強制的に整形する。
  • 検証とフィードバックのループが、生成されたコマンドをあらかじめ定義された実行可能アクションの集合に照合して解析し、不正な出力の場合はLLMに対して自動的に修正を促す。
  • この手法は、有効でロボットが読み取り可能なJSON形式でコマンドを出力し、より柔軟だが制約の弱いLLM出力と比べて、安全性と運用信頼性の双方の向上を目指す。
  • HuRICデータセットでの実験により、このハイブリッドな文法制約付きモデルは、APIベースで微調整したLLMや単体の文法駆動NLUモデルなどのベースラインよりも、コマンドの妥当性が高いことが示される。