過剰パラメータ化の時代における低コスト・バイオインスパイアの利点

arXiv cs.RO / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究はロボット制御において、2つのパラダイム(セントラル・パターン・ジェネレータと多層パーセプトロン)を対象に、大きなパラメータ空間での学習の振る舞いを体系的に検証する。
  • 入出力空間が小さく、性能が上限で制約される状況では、モデルの深さやパラメータ数を増やすことが学習を促進するどころか妨げになり得ることを示す。
  • 進化的および強化学習の学習プロトコルで行った最適化実験では、深いMLPやActor-Critic系よりも、浅いMLPと密結合のCPGがより良い性能を出した。
  • 著者らは「Parameter Impact」指標を提案し、強化学習手法が追加パラメータを多く必要としても性能向上に結びつかない場合があることを示し、進化的戦略を支持する。

要旨: 中央パターン生成器(CPG)と多層パーセプトロン(MLP)はロボット制御において広く用いられている代表的なパラダイムですが、大規模なパラメータ空間に関する相対的な利点について、体系的な研究はほとんど行われていません。入力空間と出力空間が小さく、性能がある範囲に制約される状況では、最適化すべきパラメータを増やすことは、学習を促進するというより、学習プロセスをむしろ妨げてしまう可能性があります。このことを実証的に測定するために、固有受容(プロプリオセプティブ)の能力が限られた、あるロボットの形態を与え、進化型および強化学習型のトレーナプロトコルにより、2つの生物に着想を得たパラダイム(CPGとMLP)のもとでコントローラ最適化を行います。複数の報酬関数にわたってパラメータ空間を変化させたところ、より深いMLPやActor-Criticアーキテクチャと比べて、浅いMLPと密に結合されたCPGのほうがより良い性能を示すことが観察されました。そこで、当該性能とパラメータ数との関係を説明するために、追加パラメータが必要となる強化学習手法が、より良い性能へと結びついていないことを示すParameter Impact(パラメータ影響度)という指標を導入し、進化的戦略をより有利なものとして支持します。