強化学習による二足歩行サッカーロボットの適応型マルチタスク制御

arXiv cs.RO / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、動的な環境で二足歩行サッカーロボットが複数タスクを適応的に扱いながら運動の安定性を保つための、モジュール型強化学習（RL）フレームワークを提案しています。
基本的な歩容（歩行）の生成と複雑なサッカー行動を分離するために、オープンループのフィードフォワード・オシレーターと、強化学習にもとづくフィードバック残差戦略を組み合わせています。
状態間の干渉を防ぐために、姿勢に基づく状態マシンを導入し、ボール探索・キック用ネットワーク（BSKN）と転倒回復ネットワーク（FRN）を明確に切り替えています。
FRNは、段階的な力減衰カリキュラム学習戦略によって効率よく訓練され、転倒回復の性能を他の技能の不安定化なしに高めています。
Unityシミュレーションでは、限られたコーナー状況でも確実にボールを見つけてキックできる空間適応性と、平均回復時間0.715秒の迅速な自律転倒回復が示されています。

Dev.to

Dev.to

Dev.to

Dev.to

Reddit r/LocalLLaMA