高次元ガウスノイズから全結合ニューラルネットワークで実世界分布を合成する
arXiv cs.LG / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、全結合ニューラルネットワークとランダム化された損失関数を用いて、高次元ガウスノイズを目標とする実世界の表形式データ分布へ写像する、高速な合成データ生成手法を提案する。
- 25種類の多様な実世界の表形式データセットに対する実験により、本手法は従来の最先端の生成アプローチよりも分布の類似性が高いことを示し、さらに現代の深層学習ベースの解法よりもはるかに高速に結果を生成する。
- 本研究では、分布の類似性指標(MMDを含む)、下流の分類品質、PCAに基づく次元削減を用いて評価を行い、プライバシーの向上と、時間/メモリの計算量の削減を図る。
- 著者らは、本手法を主要な合成データの目的を支援するものとして位置づけている――すなわちデータ拡張の利点、全合成サンプルによるプライバシー保護、そして元データに依存しない信頼性の高い評価である。




