勾配ベースの学習による非線形タスクから、低次元表現を効率的に符号化するデータセット蒸留

arXiv stat.ML / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、データセット蒸留について理論的に解析し、主に経験的結果に留まらず、学習に応じたデータ圧縮がどのように機能し得るかに焦点を当てる。
2層ニューラルネットワークに対する勾配ベースのデータセット蒸留を研究し、その仕組みを非線形な「マルチインデックスモデル」型のタスク構造と結び付ける。
著者らは、課題の低次元／本質的な構造が、蒸留された合成データ点によって効率的に捉えられることを証明する。
蒸留後のデータセットが、強い汎化を持つモデルを再現できることを示す一方で、メモリ計算量は~Θ(r^2 d + L)のオーダーに抑えられることを示し、圧縮率を入力次元と本質次元に関連付ける。
本研究は、特定のタスク構造と本質的次元を用いるとともに、勾配ベースの手続きのみを用いるアルゴリズムを解析した、初期の理論研究の一つであると主張している。