Dejavu:身体化知能に向けた経験フィードバック学習
arXiv cs.RO / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、実環境に投入後に新しい知識を獲得して性能向上することが難しいという課題に対し、ポストデプロイ学習の一般フレームワークDejavuを提案しています。
- Dejavuは凍結したVision-Language-Action(VLA)方策に対して、Experience Feedback Network(EFN)が参照用の実行メモリを検索し、観測に応じて参照ガイダンスを条件付けして行動予測を更新する仕組みです。
- EFNは強化学習と意味類似度に基づく報酬で学習され、現在の観測下で過去の行動に整合するように学習を促します。
- 実運用では新しい軌跡を継続的にメモリへ追加し、エージェントが経験から学習できるようにする点が特徴です。
- 幅広いエンボディド・タスクで、EFNが凍結ベースラインより適応性・頑健性・成功率を改善したと報告しています。

