創発的ニューラルオートマトン方策:視運動軌跡から象徴的構造を学習する
arXiv cs.RO / 2026/3/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、解釈可能な離散プランナーと連続制御を組み合わせることで、長期(ホライゾンの長い)ロボット学習を改善する ENAP(Emergent Neural Automaton Policy)を提案する。
- ENAPは、適応的クラスタリングに加えてL*アルゴリズム拡張を用いて、視運動のデモンストレーションからMealy状態機械を推定し、タスク固有のラベルを必要とせずに潜在するタスクモードを捉える。
- 学習した離散遷移は、その後、低レベルのリアクティブ(反応型)な残差ネットワークを条件付けし、ふるまいクローニング(BC)によって連続的な行動を学習する。
- 複雑な操作やその他の長期タスクに関する実験により、ENAPはデータが少ない設定で既存の最先端のエンドツーエンドVLA方策に比べて最大27%上回り、ロボットの意図を明示的な構造として表現できることが示される。



