創発的ニューラルオートマトン方策：視運動軌跡から象徴的構造を学習する

arXiv cs.RO / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、解釈可能な離散プランナーと連続制御を組み合わせることで、長期（ホライゾンの長い）ロボット学習を改善する ENAP（Emergent Neural Automaton Policy）を提案する。
ENAPは、適応的クラスタリングに加えてL*アルゴリズム拡張を用いて、視運動のデモンストレーションからMealy状態機械を推定し、タスク固有のラベルを必要とせずに潜在するタスクモードを捉える。
学習した離散遷移は、その後、低レベルのリアクティブ（反応型）な残差ネットワークを条件付けし、ふるまいクローニング（BC）によって連続的な行動を学習する。
複雑な操作やその他の長期タスクに関する実験により、ENAPはデータが少ない設定で既存の最先端のエンドツーエンドVLA方策に比べて最大27%上回り、ロボットの意図を明示的な構造として表現できることが示される。

AI Business

日経XTECH

Simon Willison's Blog

Dev.to

Dev.to