正しい矯正行動の拡張を伴うマルチスケール模倣学習による歩道オートパイロットの学習
arXiv cs.RO / 2026/3/25
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、歩道におけるマイクロモビリティのための模倣学習制御を対象とし、固定されたオフラインデータセットに対する標準的なILは、誤差が累積しやすく、複雑な都市環境での頑健性が弱いと主張する。
- 学習した方策が自らの誤りから回復できるようにするため、「矯正行動の拡張」として、テレオペレーションデータに多様な矯正行動とセンサ拡張を加え、学習用データを拡張することを提案する。
- 階層的な教師信号と、ホライズン(時間範囲)に基づく軌道クラスタリングを用いて、短期的なインタラクティブ挙動と長期的な目標指向の意図の両方を学習するマルチスケール模倣学習モデルを導入する。
- 多様な歩道シナリオにわたる頑健性と汎化性能の有意な改善が、実環境での実験結果として報告される。
