AI Navigate

順位上の反射拡散を用いた順列分布の学習

arXiv cs.LG / 2026/3/19

📰 ニュースModels & Research

要点

  • ソフトランク拡散は、順列を連続的なソフトランク表現へとリフトすることで、より滑らかで扱いやすい軌道を実現する離散拡散フレームワークである。
  • 前向き過程は、シャッフルベースの汚染を、構造化されたソフトランクノイズへ置換し、S_nの階乗的増大に起因する課題に対処する。
  • 逆過程は、順列の逐次的意思決定構造をより適切に捉えるため、文脈化された一般化Plackett-Luce(cGPL)デノイザーを導入する。
  • ソーティングと組合せ最適化における実験は、Soft-Rank Diffusionが従来の拡散ベースのベースラインを上回り、長いシーケンス設定で顕著な改善を示した。
  • このアプローチは、ランキングやスケジューリングなど、拡張性が高く順列の分布が重要となるタスクにおいて、順列モデリングの改善が見込まれる。

要約: 有限対称群 S_n は置換の自然なドメインを提供しますが、S_n 上の確率分布を学習することは、その階乗的に増大するサイズと離散的・非ユークリッドな構造のため難しいです。最近の置換拡散法は、シャッフルベースのランダムウォーク(例: リフルシャッフル)による前方ノイズ付加を定義し、Plackett-Luce (PL) 系統の変換を用いて逆転移を学習しますが、それにより得られる軌道は荒くなることがあり、n が大きくなるにつれてデノイズがますます難しくなります。私たちは ソフトランク拡散 を提案します。シャッフルベースの腐敗を、構造化されたソフトランク前方過程で置き換えます:離散的なランクをソフトランクへ緩和することで、順序の連続潜在表現へと引き上げ、より滑らかで扱いやすい軌道を得ます。逆過程には、従来の PL 系のパラメータ化を一般化し、逐次的な意思決定構造に対する表現力を向上させる、文脈付きの一般化 Plackett-Luce(cGPL)デノイザーを導入します。ソートおよび組合せ最適化のベンチマークにおける実験は、ソフトランク拡散が従来の拡散ベースラインを一貫して上回ることを示し、特に長い系列や本質的に逐次的な設定で顕著な利得をもたらします。