多階調ニューラルネットワーク近似

arXiv stat.ML / 2026/4/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、多階調ディープラーニング（MGDL）を、近似誤差を階層的に改良していく構造化された学習フレームワークとして提案する。具体的には、先に学習した構成要素を凍結しつつ、残差ブロックを「1つの階調（grade）」ずつ追加することで、誤差を段階的に改善する。
演算子論的な基盤を構築し、任意の連続目標関数に対して、幅が固定された多階調ReLUアーキテクチャが存在し、その残差は階調間で厳密に減少し、ゼロへ一様収束することを証明する。
著者らは、階調ごとの学習が、特定の浅い（隠れ層1層の）ReLUモデルで知られている安定性や最適化に関する保証を得るための手段である一方、それをディープネットワークへスケールさせる際には達成が難しいと位置付けている。
実験結果を報告し、理論的主張である消失する近似誤差と階層的な誤差低減を裏付ける。
総じて本研究は（著者らの知る限り）、階調ごとの学習がディープネットワークにおいて証明可能な「消失する近似誤差」をもたらすという、最初の厳密な理論保証を与えると主張している。

Abstract

多階層（multigrade）深層学習（MGDL）を、深いニューラルネットワークにおける構造化された誤差の洗練（error refinement）のための原理的枠組みとして研究する。ニューラルネットワークの近似能力は現在比較的よく理解されている一方で、非常に深いアーキテクチャの学習は、強い非凸性や多くの場合に不適切（ill-conditioned）な最適化風景のため、依然として困難である。これに対して比較的浅いネットワーク、特に1隠れ層の

exttt{ReLU}

モデルでは、学習は大域的保証を伴う凸な再定式化を許し、深さにスケールしつつ安定性を改善する学習パラダイムに動機づけを与える。MGDLは、この洞察を基に深いネットワークを段階（grade）ごとに学習することで構成される。すなわち、これまでに学習した段階は固定し、各新しい残差ブロックは残っている近似誤差を減らすことだけを目的として学習する。これにより、解釈可能で安定した階層的な洗練プロセスが得られる。私たちはMGDLのための作用素論的（operator-theoretic）基礎を構築し、任意の連続な目標関数に対して、残差が各段階を通じて厳密に減少し、かつ一様にゼロへ収束する固定幅の多階層