共強圧ゲームにおける学習のためのラストイテレート保証

arXiv stat.ML / 2026/4/22

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、ノイズのあるフィードバック下での共強圧（co-coercive）ゲームに対して、バニラな確率的勾配降下法（SGD）における「ラストイテレート」の有限時間保証を示す。
強い単調性ゲームよりも広いゲームクラスを扱い、多数のナッシュ均衡を許容する設定を含め、特定の二次ゲームやポテンシャルゲームなどの例をカバーする。
従来の「均衡近傍でノイズが消える」という相対ノイズ仮定ではなく、反復のノルムの二乗に比例（アフィン）してノイズの二次モーメントが増え得る、より一般で現実的なノイズモデルを採用する。
この非減衰ノイズのもとで、ラストイテレートの上界 O(log(t)/t^{1/3}) を導出し、反復がナッシュ均衡集合へほぼ確実に収束することに加えて、時間平均の収束保証も示す。

要旨: ノイズのあるフィードバックの下で、co-coercive（共コーサイブ）ゲームにおけるバニラ確率的勾配降下法（stochastic gradient descent）に対して、有限時間での最後の反復（last-iterate）保証を確立する。これは、強単調（strongly monotone）なゲームよりも一般的な広いクラスのゲームであり、複数のナッシュ均衡を許容し、例えば、負半定値の相互作用行列をもつ二次ゲームや、滑らかな凹ポテンシャルをもつポテンシャルゲームを含む。この設定での先行研究は、反復が均衡に近づくにつれてノイズが消失する相対ノイズ・モデルに依存してきたが、この仮定は実際にはしばしば非現実的である。我々は代わりに、ノイズの第2モーメントが、反復のノルムの2乗に対してアフィンにスケールすることを許す、はるかに一般的なノイズ・モデルの下で取り組む。この仮定は、作用空間が有界でない（unbounded）学習において自然である。このモデルのもとで、最後の反復に対する次数 $O(log(t)/t^{1/3})$ の上界を証明する。これは、非消失ノイズの下でco-coerciveゲームに対する最初のそのような上界である。さらに、反復がナッシュ均衡の集合へ確率1で収束することを示し、時間平均の収束保証を導出する。

視覚におけるオートエンコーダと表現学習

Dev.to

Google Stitch 2.0：数秒でシニア級UIを生成できるが、編集はまだ壊れる

Dev.to

AIエージェントにおけるコンテキスト肥大（Context Bloat）

Dev.to

プロダクトを開発するAI開発チームをオープンソース化しました

Dev.to

Qwen 3.6 35B A3B と Qwen 3.5 122B A10B の比較：自分では後者の方が大きく優れる

Reddit r/LocalLLaMA

共強圧ゲームにおける学習のためのラストイテレート保証

要点

関連記事

視覚におけるオートエンコーダと表現学習

Google Stitch 2.0：数秒でシニア級UIを生成できるが、編集はまだ壊れる

AIエージェントにおけるコンテキスト肥大（Context Bloat）

プロダクトを開発するAI開発チームをオープンソース化しました

Qwen 3.6 35B A3B と Qwen 3.5 122B A10B の比較：自分では後者の方が大きく優れる

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer