動的摂動下におけるエージェント中心型視覚強化学習
arXiv cs.RO / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、視覚から行動方策を学習する強化学習(RL)が、予測不能な腐敗(破損)タイプの切替のような動的・非定常な視覚摂動下でどのように性能劣化するかを調査する。
- Visual Degraded Control Suite(VDCS)を提案し、DeepMind Control SuiteにMarkovスイッチング型の劣化を拡張して、現実の「変化する」摂動条件でのロバスト性ベンチマークを作る。
- 実験では既存手法の大幅な性能低下が確認され、情報理論的解析により、再構成ベースの目的関数が摂動アーティファクトを潜在表現に不可避に混入させることが失敗要因だと理論的に示される。
- これに対し、ACO-MoE(Agent-Centric Observations with Mixture-of-Experts)を提案し、エージェント中心の復元エキスパートを用いて、摂動からの復元とタスクに関係する知覚を切り離す設計で頑健性を高める。
- VDCSおよび一般化評価でも効果が大きく、Markovスイッチング腐敗下でクリーン性能の95.3%を回復し、DMControl Generalizationで最先端(SOTA)のロバスト性結果を達成する。




