Sinkhorn漂移型生成モデル

arXiv cs.LG / 2026/3/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、漂移型生成ダイナミクスと Sinkhorn発散の勾配流との間に厳密な関連を確立し、それらが正規化カーネルを介して表現されるクロス-マイナス-セルフ構造を共有することを示している。
粒子離散化において、ドリフトはターゲットへ向かう引力項と現在のモデルへ向かう斥力項に分解され、Sinkhornスケーリングを介して定義されるSinkhorn発散は、両側のエントロピー的最適輸送結合を通じて定義される。
本研究は、Sinkhorn発散の正定性のおかげで、従来の漂流定式化における識別性のギャップを解消し、ドリフトがゼロの場合にはモデルがターゲットと等しいことを証明する。
実験では安定性とワンステップ生成品質の向上が示され、FFHQ-ALAEを低温度で用いると平均FIDが187.7から37.1へ、平均潜在空間EMDが453.3から144.4へ低下した。一方、MNISTは全クラスの網羅を維持する。なお、この手法はこれらの改善の代償として追加の学習時間を要する。

要約: 最近提案された漂移型生成ダイナミクスと Sinkhorn 発散によって誘導される勾配流との理論的な結びつきを確立します。粒子離散化では、ドリフト場にはクロス-マイナス-セルフ分解が成り立ちます。ターゲット分布へ向かう引力項と現在のモデルへ向かう反発/自己補正項の2つの成分が、片側正規化された Gibbs カーネルを介して表現されます。Sinkhorn 発散は類似のクロス-マイナス-セルフ構造を生み出しますが、それぞれの項は両側の Sinkhorn スケーリングを通じて得られるエントロピー的最適輸送結合によって定義されます（すなわち、両方のマージナルを強制する）。これにより、ドリフティングが Sinkhorn 発散勾配流の代理表現として機能するという正確な意味が得られ、一方の側の正規化と完全な両側 Sinkhorn スケーリングとの間を補間します。特に、この結びつきは従来のドリフティング定式化に存在した識別可能性のギャップを解消します。Sinkhorn 発散の正定性を活用して、ドリフトがゼロ、すなわちダイナミクスの平衡を意味する場合には、モデルとターゲットの測度が一致することを示します。実験では、Sinkhorn ドリフティングがカーネル温度への感度を低減し、1ステップ生成品質を向上させることを示しており、追加の学習時間と引き換えにより安定した最適化を実現しますが、ドリフト法で用いられる推論手順を変更することはありません。これらの理論的利益は、実践での低温度条件下で強力な改善をもたらします。評価対象のFFHQ-ALAEでは、最も低い温度設定で、平均FIDを187.7から37.1へ、平均潜在 EMD を453.3から144.4へ低減し、MNIST では温度スイープ全体を通じて全クラスの網羅性を維持します。プロジェクトページ: https://mint-vu.github.io/SinkhornDrifting/

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

Dev.to

MCPスキルとMCPツール: サーバーを正しく構成する方法

Dev.to

2026年にすべてのコンテンツクリエイターが必要とする500のAIプロンプト（20件の無料サンプル付き）

Dev.to

娘のためのAIを活用したゲームを作る — 第1部: 彼女も作れるとしたら？

Dev.to

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

THE DECODER

Sinkhorn漂移型生成モデル

要点

関連記事

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

MCPスキルとMCPツール: サーバーを正しく構成する方法

2026年にすべてのコンテンツクリエイターが必要とする500のAIプロンプト（20件の無料サンプル付き）

娘のためのAIを活用したゲームを作る — 第1部: 彼女も作れるとしたら？

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer