VISION-SLS:学習した視覚表現からのシステムレベル合成による安全な知覚ベース制御
arXiv cs.LG / 2026/4/29
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- VISION-SLSは、高解像度RGB画像から非線形の出力フィードバック制御を行い、較正された不確実性の範囲でも頑健に制約充足を保証する手法である。
- 本手法は、事前学習済み視覚特徴から状態依存の誤差境界付きで学習した低次元の観測写像と、System Level Synthesis(SLS)で最適化する因果的なアフィン時間変化型の出力フィードバック方策を組み合わせている。
- 非凸な最適化問題に対して、逐次凸最適化(sequential convex programming)と効率的なRiccati再帰を活用するスケーラブルなソルバを新たに開発した。
- シミュレーションでは、4Dカート、10Dクアッドローターに加え、部分観測下の59Dヒューマノイドで、安全な情報収集行動と、経験的に較正した誤差境界に基づく制約充足が示された。
- ハードウェア実証では、車載画像による地上車両の安全な制御に成功し、ベースラインより安全率と解法時間で優れており、実装コードはGitHubで公開されている。



