進化するディープラーニング最適化手法(R)

Reddit r/MachineLearning / 2026/5/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • この記事では、遺伝的アルゴリズムによりディープラーニングの最適化アルゴリズムを自動発見する枠組みを提示している。
  • 最適化手法は、勾配・モメンタム・RMS正規化・Adam風の適応的項・符号ベース更新などの基本更新要素を組み合わせ、さらにハイパーパラメータやスケジューリング選択を含む「ゲノム」として符号化される。
  • 50世代・個体数50の進化探索を複数の視覚タスクで評価した結果、進化した最適化手法はAdamに対して総合適応度で2.6%上回り、CIFAR-10でも相対的に7.7%の改善を達成した。
  • 最良の進化手法は、符号ベースの勾配更新と適応モーメント推定を組み合わせ、Adamより低いモメンタム係数を用いながらバイアス補正を無効化し、学習率ウォームアップとコサイン減衰を有効化している。
  • これらの結果は、進化探索が競争力のある最適化手法を見つけ得ること、そして手作りの最適化手法とは異なる設計原理を明らかにし得ることを示している。

深層学習の最適化アルゴリズムを自動的に発見するための遺伝的アルゴリズムの枠組みを提示します。

本アプローチでは、オプティマイザを、基本的な更新項(勾配、モメンタム、RMS正規化、Adamスタイルの適応項、符号に基づく更新)と、ハイパーパラメータおよびスケジューリングオプションの組み合わせを指定するゲノムとして符号化します。

50世代にわたる個体数50の進化探索を行い、複数の視覚タスクにわたって評価した結果、Adamを総合適応度(aggregate fitness)で2.6%上回り、CIFAR-10で7.7%の相対的改善を達成する進化済みオプティマイザを発見しました。

進化済みオプティマイザは、符号に基づく勾配項と適応的モーメント推定を組み合わせ、Adamよりも低いモメンタム係数( =0.86, =0.94)を用います。また、特筆すべき点として、バイアス補正を無効化しつつ、学習率ウォームアップとコサイン減衰を有効にします。

本結果は、進化探索によって競争力のある最適化アルゴリズムが発見でき、手作りのオプティマイザとは異なる設計原理が明らかになることを示しています。

投稿者 /u/EducationalCicada
[link] [comments]