Abstract
損失関数の有界性を仮定せずに、2層ニューラルネットワークの学習に対する一般化誤差の上界を導出する。具体的には、確率分布とそれに対応する経験分布の間の相違に関してウォッサースタイン距離の推定を用い、さらに関連する確率的勾配法に対するモーメントの上界を併用する。テストデータが独立である場合、nサンプルの一般化誤差に対して次元に依存しないオーダー O(n^{-1/2} ) の率を得る。一方、独立性の仮定を置かない場合には、入力次元と出力次元をそれぞれ d_{
m in}、d_{
m out} として、オーダー O(n^{-1 / ( d_{
m in}+d_{
m out} )} ) の上界を導出する。これらの上界およびその係数は、モデルの学習前に明示的に計算でき、数値シミュレーションによって確認される。


