広告

創発的ニューラルオートマトン方策:視運動軌跡から象徴的構造を学習する

arXiv cs.RO / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、解釈可能な離散プランナーと連続制御を組み合わせることで、長期(ホライゾンの長い)ロボット学習を改善する ENAP(Emergent Neural Automaton Policy)を提案する。
  • ENAPは、適応的クラスタリングに加えてL*アルゴリズム拡張を用いて、視運動のデモンストレーションからMealy状態機械を推定し、タスク固有のラベルを必要とせずに潜在するタスクモードを捉える。
  • 学習した離散遷移は、その後、低レベルのリアクティブ(反応型)な残差ネットワークを条件付けし、ふるまいクローニング(BC)によって連続的な行動を学習する。
  • 複雑な操作やその他の長期タスクに関する実験により、ENAPはデータが少ない設定で既存の最先端のエンドツーエンドVLA方策に比べて最大27%上回り、ロボットの意図を明示的な構造として表現できることが示される。

広告