制御に基づく学習によるオンライン意図予測
arXiv cs.RO / 2026/4/13
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自律システムの意図(目標状態)をリアルタイムに予測するためのオンライン枠組みを提案し、意図が時間とともに変化する場合も扱う。
- 意図予測を、逆最適制御/逆強化学習の問題として定式化し、意図を目的関数内のパラメータとして扱う。
- シフトするホライズン戦略により、古くなった観測の重みを下げて、時間変化する振る舞いに対する頑健性を向上させる。
- 本手法は、制御に基づくオンライン学習を用いることで、効率的な勾配計算と、未知パラメータの連続的なオンライン更新を可能にする。
- さまざまなノイズ条件でのシミュレーションおよび実機のクアッドロータ実験により、複雑な環境における適応的で改善された意図予測が示される。




