SignSGDの改善:スモールバッチ収束解析とハイブリッド切替戦略
arXiv cs.LG / 2026/4/29
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、1ビット量子化とダザリング(dithering)の観点からSignSGDを再検討し、勾配の大きさ情報を失うことに起因する、調整済みSGDに対する一般化ギャップに対処する3つの改善を提案している。
- 片側の大バッチ仮定を取り除き、信号対雑音を重み付けした停留(stationarity)指標を用いることで、単峰対称な勾配ノイズ下におけるSignSGDのスモールバッチ収束率を導出している。
- さらに、符号演算の直前にアニーリングしたガウスノイズを注入し、古典的ダザリングとしてハードしきい値化で失われた大きさ情報を確率的にある程度復元する。
- そして、投影ベースの学習率キャリブレーションによって符号更新に合わせてSWATSを適応し、SignSGDからSGDへと滑らかに遷移させるハイブリッド切替を実現している。
- ResNet-18で単一ワーカー実験を行い通信要因を切り離した結果、符号前ダザリングはCIFAR-100でAdamを上回り、キャリブレーション付きの切替戦略はCIFAR-10で92.18%のテスト精度を達成し、純粋SGD(91.38%)とSignSGD(モメンタム付き、90.82%)の両方を上回った。


