ZO-SAM: 効率的なスパース学習のためのゼロ次最適化とシャープネスを意識した最小化

arXiv cs.LG / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

ZO-SAMはゼロ次最適化とシャープネスを意識した最小化を組み合わせ、摂動による逆伝播を1ステップに抑える。
従来のSAMと比較して逆伝播コストを半分に抑え、勾配の分散を低減させ、スパース学習のボトルネックに対処する。
本手法はSAMの平坦な局所極小値の探索を活用し、訓練を安定化させ、スパースネットワークの収束を加速する。
ZO-SAMで訓練したモデルは、分布の変化下での頑健性が向上し、実世界での適用範囲を広げる。

要旨: 深層学習モデルは、その顕著な成果にもかかわらず、高い計算コストとメモリ要件に悩まされており、リソース制約のある環境での利用を制限している。スパースニューラルネットワークは、パラメータ数と計算オーバーヘッドを劇的に削減することにより、これらの制約を大幅に緩和します。しかし、既存のスパーストレーニング手法はしばしば混沌としたノイズの多い勾配信号を経験し、収束と一般化性能を著しく妨げることが多く、特に高いスパース性レベルで顕著です。この重要な課題に対処するため、Zero-Order Sharpness-Aware Minimization（ZO-SAM）という新しい最適化フレームワークを提案します。これは、SAMアプローチ内に戦略的にゼロ次最適化を組み込むものです。従来のSAMとは異なり、ZO-SAMは摂動時にわずか1回の誤差逆伝播ステップのみを必要とし、ゼロ次勾配推定を選択的に利用します。この革新的な手法は、従来のSAMと比較してバックプロパゲーションの計算コストを半分に削減し、勾配の分散を大幅に低減し、関連する計算オーバーヘッドを効果的に排除します。平坦な極小値を識別するSAMの能力を活用することで、ZO-SAMは学習過程を安定させ、収束を加速します。これらの効率向上は、スパーストレーニングの状況で特に重要であり、計算コストがSAMの実用性を制限する主要なボトルネックとなっているためです。さらに、ZO-SAMで訓練されたモデルは、分布シフトに対する頑健性が向上し、実世界の展開における実用性をさらに広げます。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

ZO-SAM: 効率的なスパース学習のためのゼロ次最適化とシャープネスを意識した最小化

要点

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer