SEDGE: Structural Extrapolated Data Generation

arXiv cs.LG / 4/6/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

Key Points

  • 本論文は、データ生成過程に関する仮定のもとで「Structural Extrapolated Data Generation(SEDGE)」を行うためのフレームワークを提案している。
  • 新たな仕様を満たすデータを信頼性高く生成できる条件や、特定の「保守的(conservative)」仮定下での分布の(近似)識別可能性を論じている。
  • 実装面では、構造を考慮した最適化戦略、ならびに拡散モデルを用いたposterior samplingに基づく実用的手法を開発している。
  • 合成データでの性能検証に加え、拡張(extrapolated)画像生成を実世界シナリオとして、枠組みの妥当性を示している。

Abstract

This paper proposes a framework for Structural Extrapolated Data GEneration (SEDGE) based on suitable assumptions on the underlying data generating process. We provide conditions under which data satisfying new specifications can be generated reliably, together with the approximate identifiability of the distribution of such data under certain ``conservative" assumptions. On the algorithmic side, we develop practical methods to achieve extrapolated data generation, based on the structure-informed optimization strategy or diffusion posterior sampling, respectively. We verify the extrapolation performance on synthetic data and also consider extrapolated image generation as a real-world scenario to illustrate the validity of the proposed framework.