MAVEN-T: 強化学習を用いた、マルチエージェントの環境認識を備える拡張ニューラルトラジェクトリ予測
arXiv cs.AI / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、自動運転に向けた教師–生徒型の軌道予測フレームワークであるMAVEN-Tを提案し、複雑なマルチエージェントの意思決定を維持しつつ、リアルタイム制約を満たすことを目的とする。
- 教師側ではハイブリッド注意機構を用い、生徒側には効率的なアーキテクチャを採用する。さらに、マルチグラニュラでの段階的蒸留に加え、適応的カリキュラム学習を組み合わせることで、知識の移転を効果的に行う。
- 通常の蒸留における「模倣の天井(imitation ceiling)」への対処として、MAVEN-Tは強化学習を追加し、生徒が動的な環境と相互作用することで、教師由来の振る舞いを改良・最適化できるようにする。
- NGSIMおよびhighDでの実験により、高い効率向上が報告されている。パラメータ圧縮で6.2倍、推論速度で3.7倍の高速化を達成しつつ、最先端の精度を維持する。
- 著者らは、これにより教師モデル単独の場合よりも、計算資源の制限下での導入において、より頑健な意思決定が可能になると主張している。
