ReCAPA:カスケード障害を軽減する階層型予測補正
arXiv cs.AI / 2026/4/25
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、視覚言語行動(VLA)システムに対して、途中の誤りが長いマルチステップ課題で連鎖的(カスケード的)に拡大するのを防ぐことを目的としたReCAPAを提案しています。
- ReCAPAは、予測/コントラストと意味アラインメントを組み合わせ、行動・サブゴール・軌跡の3つの階層レベルで逸脱を補正します。
- 予測補正とアラインメントは学習中にアクション生成器へ統合され、細かな手順が全体の意図に沿い続けるように調整することを可能にします。
- 著者らは、長期実行における誤りの伝播と回復を定量化するための2つの新しい指標を提案し、誤りがどのように広がり、どの程度減衰するかを捉えます。
- VisualAgentBench、MineDojo、AI2-THORといったエンボディドエージェントのベンチマークで、プロプライエタリおよびオープンソースの強力なLLM基準モデルを上回るなど、競争力のある結果が報告されています。



