GANにおけるMany-to-One Collapse(多対一崩壊)を抑制するためのペアリング正則化

arXiv cs.LG / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、GANの失敗モードのうち比較的注目されていなかった「多対一(intra-mode)崩壊」—異なる潜在コードが同一または非常に類似した出力を生む—に取り組みます。
  • ジェネレータと同時に最適化する「ペアリング正則化」を提案し、潜在変数と生成サンプルの局所的な整合性を強制します。
  • 効果は学習の失敗レジームに依存し、探索が限られていて崩壊しやすい状況では構造化された局所探索を促し、カバレッジとリコールを向上させます。
  • さらに探索が十分で学習が安定している場合は、冗長な写像を抑えることでリコールを損なわずに精度(precision)を高めます。
  • おもちゃの分布と実画像ベンチマークの両方での実験により、本正則化はintra-mode collapseを直接対象化することで、既存のGAN安定化手法と補完的に機能することが示されます。

Abstract

モード崩壊は、生成対向ネットワーク(GAN)の学習における根本的な課題である。既存研究の多くは、モード落ちのようなモード間崩壊に主に焦点を当ててきた。一方で、同一または高度に類似した出力に多くの潜在変数がマッピングされる「モード内崩壊」には、これまで十分な注目が払われてこなかった。本研究では、潜在変数と生成サンプルの間に局所的な整合性を強制することで、多対一の崩壊を緩和するための、ジェネレータと共同で最適化されるペアリング正則化器を提案する。ペアリング正則化の効果は、学習の支配的な失敗モードに依存することを示す。探索が限られた崩壊しやすい状況では、ペアリングは構造化された局所探索を促し、カバレッジの向上と高いリコールにつながる。対照的に、十分な探索によって安定化された学習のもとでは、ペアリングは冗長な写像を抑制することで、ジェネレータが誘導するデータ密度を洗練し、リコールを損なうことなく精度を改善する。おもちゃ分布と実画像ベンチマークの両方に対する大規模な実験により、提案する正則化器は、モード内崩壊を直接扱うことで、既存の安定化手法を効果的に補完することを示す。