要旨: 信号時相論理(STL)は検証可能なタスク仕様を提供し、安全性が重要な制御にとって不可欠です。しかし、STLの計画は依然として困難です。すなわち、厳密な最適化に基づく手法はしばしば計算が遅すぎ、学習ベースの手法は環境の変化にまたがって一般化するのが難しいのです。本研究では、可変地図環境向けのゼロショットSTL計画ソルバを提案します。この手法は、再学習なしで実行可能な軌道を生成します。地図に条件付けされたTransformerアーキテクチャと軽量なヒューリスティックを統合することで、複雑な選言(OR)サブフォーミュラを効果的に扱えます。さらに、分解されたサブタスク間で一貫した時間的な整合と論理的一貫性を保証するために、推移的強化学習(Transitive Reinforcement Learning; TRL)を活用します。多様な障害物配置を伴う動的意味地図に関する実験では、一貫した改善が示され、本フレームワークが環境が変化しても優れたゼロショットな汎化性能を発揮し、かつ広範なSTLをカバーできることが強調されます。
動的セマンティックマップにおける分岐選択(選言)を伴うゼロショット信号時相論理計画
arXiv cs.AI / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、可変で動的なセマンティックマップ環境を対象に、再学習なしで実行可能な軌道を生成するゼロショットの信号時相論理(STL)計画ソルバを提案している。
- マップ条件付きTransformerアーキテクチャと軽量なヒューリスティックを統合し、複雑な選言(OR)サブフォーミュラに対して特に有効に軌道生成を行う。
- 分解されたサブタスク間で時間的根拠と論理整合性を保つために、Transitive Reinforcement Learning(TRL)を用いて、時間的な整合と論理的一貫性を確保する。
- 多様な障害物配置を含む動的セマンティックマップでの実験では一貫した改善が示され、変化する環境へのゼロショット汎化性能と、STL適用範囲の広さが示唆される。




