確率的保証を備えたStable GFlowNets
arXiv cs.LG / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、生成フロー・ネットワーク(GFlowNets)が実運用で不安定になり得る理由を分析し、学習分布とターゲット分布の総変動距離(TV)が小さくても学習損失が発散し得ることを示します。
- 「逆方向」の理論保証として、軌道バランス損失が制限されていることから大域的な忠実性(fidelity)を導く、損失とTVの関係に基づく境界を導出します。
- これらの結果に動機づけられ、著者らは学習時の大きな損失スパイクを抑え、モード崩壊を緩和することを目的にStable GFlowNetsという新しい学習アルゴリズムを提案します。
- 実験では、Stable GFlowNetsが従来手法よりも学習安定性と分布の忠実度の両面で優れていることが示されます。
- 総じて本研究は、GFlowNets学習をより確かなものにする理論的基盤と実用的手法の両方を提供します。




