三層ニューラルネットワークの局所学習係数の上界

arXiv cs.LG / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

著者らは、三層ニューラルネットワークの特異点における局所学習係数の上界公式を導出し、特異学習モデルのベイズ的漸近法を前進させた。
この公式は、予算および需要と供給の制約の下でのカウント規則として機能し、swish活性化関数を含む解析的活性化関数の広いクラスに適用可能である。
一次元入力の場合、上界は既知の学習係数と一致し、先行研究の不一致を部分的に解消する。
この結果は、活性化関数やアーキテクチャを横断して、ネットワークの重みパラメータが学習係数をいかに形作るかについて、体系的な視点を提供する。

要旨: 三層ニューラルネットワークは特異学習モデルを形成することが知られており、それらのベイズ漸近挙動は学習係数、すなわち実対数正準閾値によって支配される。正則モデルおよびいくつかの特異モデルにはこの量はすでに明確化されているが、ニューラルネットワークにおける評価方法は広く適用可能なものが依然として限られている。
　最近、半正則モデルの局所学習係数の公式が提案され、学習係数の上限を与える。しかしこの公式は実現パラメータ集合内の非特異点のみに適用され、特異点では用いることができない。特に、三層ニューラルネットワークについては、得られる上限が既知の学習係数の値と著しく異なるケースがあることが示されている。
　本論文では、三層ニューラルネットワークにおける特異点での局所学習係数の上限公式を導出する。この式は予算制約と需要供給制約の下でのカウント規則として解釈でき、一般的な解析的活性化関数に適用可能である。特に、swish関数および多項式関数を含み、以前の結果をより広い活性化関数のクラスへ拡張する。
　さらに、入力次元が1の場合、ここで得られる上限は既知の学習係数と一致し、前述の不一致を部分的に解決する。私たちの結果は、三層ニューラルネットワークの重みパラメータが学習係数に与える影響について体系的な視点を提供する。

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

三層ニューラルネットワークの局所学習係数の上界

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer