広告

信号時相論理(STL)仕様の翻訳と修復による、LLMを活用した低高度UAVの自然言語ナビゲーション

arXiv cs.RO / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、低高度UAVの自然言語によるナビゲーション指示を信号時相論理(STL)仕様へ変換し、さらに混合整数線形計画法(MILP)によって安全な軌道を合成する枠組みを提示する。
  • 文自由形式のテキストを実行可能なSTL式へ翻訳する際の構文的妥当性と意味的整合性を高めるため、chain-of-thought(CoT)による教師あり学習と、グループ相対方策最適化(GRPO)を用いて推論強化型LLMを導入する。
  • 実行不能、または過度に厳格な要求に対処するため、MILPベースの診断に加えてLLMが導く意味推論を用いる仕様修復メカニズムを追加し、安全性の保証を維持しつつ制約を緩和する。
  • 著者らは、大規模なシミュレーションと実環境での飛行実験の結果として、NL-to-STL(自然言語からSTLへの変換)の堅牢性が向上し、複雑な環境における解釈可能で適応可能な、安全性クリティカルなUAVナビゲーションが可能になることを報告している。

Abstract

低高度無人航空機(UAV)のための自然言語(NL)ナビゲーションは、非専門オペレータに直感的なインターフェースを提供することで、低高度の航空サービスに対するインテリジェントで便利なソリューションを実現します。しかし、この機能を都市環境で展開するには、曖昧に記述された指示を、安全性に直結する重要な(safety-critical)かつ時空間制約の下で動的に実行可能な運動計画へと精密に実装(grounding)する必要があります。この課題に対処するために、我々は、NL指示をシグナル時相論理(Signal Temporal Logic; STL)仕様へと変換し、その後に混合整数線形計画法(MILP)によって軌道を合成する統一的な枠組みを提案します。具体的には、自由形式のNLから実行可能なSTL式を生成するために、連鎖思考(CoT)による教師あり学習と、グループ相対方策最適化(GRPO)を活用した、推論強化型の大規模言語モデル(LLM)を開発し、高い構文妥当性と意味的一貫性を保証します。さらに、厳格な論理要求または空間要求が原因で生じる実行不能性(infeasibilities)を解消するために、仕様修復(specification repair)メカニズムを導入します。このモジュールは、MILPベースの診断と、LLMによる意味論的推論を組み合わせることで、タスク制約を選択的に緩和しつつ、安全性保証は厳密に維持します。大規模なシミュレーションおよび実世界の飛行実験の結果、提案するクローズドループ枠組みは、NLからSTLへの変換の頑健性を大幅に向上させ、複雑な状況において安全で解釈可能かつ適応可能なUAVナビゲーションを実現することが示されました。

広告