Neural Collapse Dynamics:深さ、活性化、正則化、特徴ノルムのしきい値
arXiv cs.LG / 2026/4/2
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ニューラル・コラプス(直前層の特徴が単体の等角緊密フレームへ収束する現象)がどのように始まるかを調べ、平衡状態の理解にとどまらず、発現の立ち上がりダイナミクスを特徴づける。
- モデルとデータセットに固有な臨界しきい値 f_{n}* を、平均特徴ノルムが横切ったときにニューラル・コラプスが生じるという予測的な規則性を提案する。このしきい値は、各(モデル、データセット)ペアの範囲では、訓練条件に対して概ね不変である。
- 標準的な訓練軌道では、特徴ノルムのしきい値の横切りがニューラル・コラプスの発現に先行し、その平均リードタイムは62エポックであることが一貫して観測され、実用的なタイミング予測が可能になる。
- 勾配フロー介入の実験により、f_{n}* が安定なアトラクタとして振る舞うことが示される。特徴スケールに対する摂動は訓練中に自己修正され、同じしきい値の値へ収束する。
- (アーキテクチャ)×(データセット)の格子全体で最も強い結果は、MNISTに対する大きなアーキテクチャ効果である(例:ResNet-20で f_{n}* = 5.867)。また、非加法的な相互作用が強く観測され、さらに重み減衰や幅による加速効果によって支配される位相図のような挙動も見られる。




