リプシッツ損失関数を用いる2層ニューラルネットワークに対する一般化誤差の上界

arXiv stat.ML / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、真のデータ分布とその経験的分布との間のワッサースタイン距離の推定に基づいて、2層ニューラルネットワークの学習に対する一般化誤差の上界を導出する。
損失関数が有界であることを要求せず、代わりに確率的勾配法に結び付いたモーメントの上界に依拠する。
独立なテストデータに対して、サンプルサイズを n としたときの次元に依存しない一般化率 O(n^{-1/2}) を示す。
学習データとテストデータの独立性が仮定できない場合、上界は O(n^{-1/(d_in+d_out)}) まで悪化し、入力次元 d_in と出力次元 d_out に依存する。
得られる上界（係数を含む）は学習前に計算可能であり、数値シミュレーションによって裏付けられる。

Abstract

損失関数の有界性を仮定せずに、2層ニューラルネットワークの学習に対する一般化誤差の上界を導出する。具体的には、確率分布とそれに対応する経験分布の間の相違に関してウォッサースタイン距離の推定を用い、さらに関連する確率的勾配法に対するモーメントの上界を併用する。テストデータが独立である場合、

n

サンプルの一般化誤差に対して次元に依存しないオーダー

O(n^{-1/2} )

の率を得る。一方、独立性の仮定を置かない場合には、入力次元と出力次元をそれぞれ

d_{ m in}

、

d_{ m out}

として、オーダー

O(n^{-1 / ( d_{ m in}+d_{ m out} )} )

の上界を導出する。これらの上界およびその係数は、モデルの学習前に明示的に計算でき、数値シミュレーションによって確認される。

Black Hat Asia

AI Business

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

日経XTECH

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

日経XTECH

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

リプシッツ損失関数を用いる2層ニューラルネットワークに対する一般化誤差の上界

要点

Abstract

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画 テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造 ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」