深層学習におけるクロスエントロピー学習のためのレイヤ分離最適化フレームワーク
arXiv cs.LG / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、softmaxクロスエントロピー損失で学習する深層学習モデルの最適化を扱い、学習中に生じる強い非凸性という課題を緩和することを目的としています。
- 隠れ層出力に対応する補助変数を導入し、元の難しいネストされた最適化問題を一連のより扱いやすい部分問題へ分解する「レイヤ分離」戦略を提案しています。
- 提案するレイヤ分離損失が、元のクロスエントロピー損失の上界になることを示す理論結果を導出しています。
- 交互最小化アルゴリズムを設計し、適切な条件下で損失関数が単調に減少することを証明しています。
- 実験では、全結合ニューラルネットワークおよび畳み込みニューラルネットワークで最適化挙動の改善が確認され、フレームワークの有効性が裏付けられています。




