微調整なしでVLAを展開するために:エンベデッド進化的拡散による推論時プラグアンドプレイVLAポリシー誘導
arXiv cs.RO / 2026/4/17
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 視覚と言語と行動を扱うVLAモデルはロボティクス操作で有望だが、事前学習ポリシーは下流環境の導入時に大きく性能が落ちるという課題がある。
- 本研究は、微調整や追加のデータ収集を一切行わず、推論時のみでVLAポリシーを誘導する「VLA-Pilot」を提案しており、事前学習済みモデルのゼロショット展開をプラグアンドプレイで可能にする。
- VLA-Pilotは2種類のロボット形態と実環境の6つのタスクで評価され、イン・ディストリビューションだけでなくアウト・オブ・ディストリビューションでも有効性が確認された。
- 実験結果は、既製の事前学習済みVLAポリシーの成功率を大幅に向上させ、多様なタスクや機体への堅牢なゼロショット汎化を実現できることを示している。



