DeepWeightFlow:ニューラルネットワーク重みを生成するための再ベースライン付きフローマッチング
arXiv stat.ML / 2026/5/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- DeepWeightFlowは、重み空間でニューラルネットワークの“完全な重み”を直接生成するフローマッチング系の生成モデルを提案し、部分的な重み生成に限られる従来手法や、生成速度の遅さ/微調整(ファインチューニング)を要する手法の課題に取り組みます。
- この手法は高精度であり、さまざまなアーキテクチャ、ネットワーク規模、データモダリティにわたってスケールすることを主張しており、生成されたネットワークは良好な性能を得るのに微調整を不要とすると述べられています。
- ニューラルネットワークに存在する置換対称性の影響を抑え、大規模モデルでの効率を高めるために、生成重みの文脈でGit Re-BasinとTransFusionによる正準化(カノニカライゼーション)を適用します。
- さらに、転移学習での優れた性能と高速なアンサンブル生成を報告しており、拡散ベースの方法より大幅に速く、数百のニューラルネットワークを数分で生成できるとしています。
- 総じて本研究は、多様なニューラルネットワーク集合をより効率的かつスケーラブルに生成できる道を開き、下流のモデル開発や実験を加速することを目指しています。




