信号時相論理（STL）仕様の翻訳と修復による、LLMを活用した低高度UAVの自然言語ナビゲーション

arXiv cs.RO / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、低高度UAVの自然言語によるナビゲーション指示を信号時相論理（STL）仕様へ変換し、さらに混合整数線形計画法（MILP）によって安全な軌道を合成する枠組みを提示する。
文自由形式のテキストを実行可能なSTL式へ翻訳する際の構文的妥当性と意味的整合性を高めるため、chain-of-thought（CoT）による教師あり学習と、グループ相対方策最適化（GRPO）を用いて推論強化型LLMを導入する。
実行不能、または過度に厳格な要求に対処するため、MILPベースの診断に加えてLLMが導く意味推論を用いる仕様修復メカニズムを追加し、安全性の保証を維持しつつ制約を緩和する。
著者らは、大規模なシミュレーションと実環境での飛行実験の結果として、NL-to-STL（自然言語からSTLへの変換）の堅牢性が向上し、複雑な環境における解釈可能で適応可能な、安全性クリティカルなUAVナビゲーションが可能になることを報告している。

Abstract

低高度無人航空機（UAV）のための自然言語（NL）ナビゲーションは、非専門オペレータに直感的なインターフェースを提供することで、低高度の航空サービスに対するインテリジェントで便利なソリューションを実現します。しかし、この機能を都市環境で展開するには、曖昧に記述された指示を、安全性に直結する重要な（safety-critical）かつ時空間制約の下で動的に実行可能な運動計画へと精密に実装（grounding）する必要があります。この課題に対処するために、我々は、NL指示をシグナル時相論理（Signal Temporal Logic; STL）仕様へと変換し、その後に混合整数線形計画法（MILP）によって軌道を合成する統一的な枠組みを提案します。具体的には、自由形式のNLから実行可能なSTL式を生成するために、連鎖思考（CoT）による教師あり学習と、グループ相対方策最適化（GRPO）を活用した、推論強化型の大規模言語モデル（LLM）を開発し、高い構文妥当性と意味的一貫性を保証します。さらに、厳格な論理要求または空間要求が原因で生じる実行不能性（infeasibilities）を解消するために、仕様修復（specification repair）メカニズムを導入します。このモジュールは、MILPベースの診断と、LLMによる意味論的推論を組み合わせることで、タスク制約を選択的に緩和しつつ、安全性保証は厳密に維持します。大規模なシミュレーションおよび実世界の飛行実験の結果、提案するクローズドループ枠組みは、NLからSTLへの変換の頑健性を大幅に向上させ、複雑な状況において安全で解釈可能かつ適応可能なUAVナビゲーションを実現することが示されました。