安全のための制約付きデコーディング:ロボット航行基盤モデル
arXiv cs.RO / 2026/4/17
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- この論文は、安全のための制約付きデコーディング枠組みSafeDecを提案し、データ駆動型ロボット基盤モデルが持ちがちな「行動の正しさ(behavioral correctness)」の欠如に対処します。
- SafeDecは、Signal Temporal Logic(STL)式として表された安全要件を、前提とした力学モデルの下で生成された行動がSTL制約を満たすことを“証明可能”にする形で、実行時の行動生成を制御します。
- この手法は再学習を不要とし、ポリシーに依存しない(policy-agnostic)ため、推論時の介入としてさまざまなロボット航行基盤モデルに適用できます。
- CHORESベンチマークのタスクを、手続き的に生成された多数の環境(数百)で評価した結果、SafeDecは危険な行動の除外だけでなく条件付き行動生成にも有用であることが示されました。
- この手法は自己回帰(次のトークン/行動)生成を想定しており、形式手法と基盤モデル型ロボティクスを組み合わせて、安全な航行挙動を実現することを狙っています。




