高次元ガウスノイズから全結合ニューラルネットワークで実世界分布を合成する

arXiv cs.LG / 2026/4/13

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、全結合ニューラルネットワークとランダム化された損失関数を用いて、高次元ガウスノイズを目標とする実世界の表形式データ分布へ写像する、高速な合成データ生成手法を提案する。
  • 25種類の多様な実世界の表形式データセットに対する実験により、本手法は従来の最先端の生成アプローチよりも分布の類似性が高いことを示し、さらに現代の深層学習ベースの解法よりもはるかに高速に結果を生成する。
  • 本研究では、分布の類似性指標(MMDを含む)、下流の分類品質、PCAに基づく次元削減を用いて評価を行い、プライバシーの向上と、時間/メモリの計算量の削減を図る。
  • 著者らは、本手法を主要な合成データの目的を支援するものとして位置づけている――すなわちデータ拡張の利点、全合成サンプルによるプライバシー保護、そして元データに依存しない信頼性の高い評価である。