広告

Ego-Foresight:強化学習を改善するためのエージェント対応表現の自己教師あり学習

arXiv cs.RO / 2026/4/2

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、自己の運動を手がかりとしてエージェント対応表現を分解する自己教師あり学習手法であるEgo-Foresight(EF)を提案する。これは、人の運動予測や自己モデリングから着想を得ている。
  • EFは、特徴学習における補助タスクとして機能することでRLを改善するよう設計されており、教師ありの信号を必要とせずにエージェントの認識を提供することにより、RLをよりサンプル効率よくすることを目指す。
  • 実験では、エージェントの動きを予測し分解するEFの能力を評価し、自己教師あり方式でエージェント情報を効果的に学習できることを示している。
  • 著者らは、シミュレーション環境での制御タスクにおいて、EFをモデルフリーおよびモデルベース双方のRLに統合し、ベースラインと比較してサンプル効率と全体的な性能が向上したと報告している。

広告