FVD:Fleming-Viot Resampling による拡散モデルの推論時アラインメント
arXiv cs.AI / 2026/4/10
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、SMCベースのアプローチでよく見られる多様性の崩壊(diversity collapse)および系統の崩壊(lineage collapse)を対象とする、拡散サンプラのための推論時アラインメント手法「Fleming-Viot Diffusion(FVD)」を提案する。
- FVDは、マルチノミアル・リサンプリングを、Fleming-Viotに着想を得た出生・死滅(birth-death)メカニズムで置き換える。報酬に基づく生存判断を独立に行い、報酬が概ねしか得られない場合には、確率的な再誕生(rebirth)ノイズを用いる。
- この手法は、価値(value)関数の近似やコストの高いロールアウトを必要とせずに、より広い軌道(trajectory)の支持を維持しつつ、報酬に傾いた分布(reward-tilted distributions)を効率よく探索することを目指す。
- 本手法は完全に並列化可能であり、推論計算に対して効率よくスケールするため、大規模なサンプリング作業に実用的である。
- 実験では強い改善が報告されている。たとえば、ImageReward における DrawBench で約7%の向上、クラス条件付きタスクで FID が 14〜20% 改善、価値ベースの手法に比べて最大66倍高速である。

