潜在ストキャスティック補間子(Latent Stochastic Interpolants)

arXiv stat.ML / 2026/4/23

💬 オピニオンModels & Research

要点

  • 本論文は、学習した潜在空間で分布間の補間・生成を可能にする、Stochastic Interpolantsの拡張として「潜在ストキャスティック補間子(LSI)」を提案する。
  • 従来のSI手法が2つの分布のサンプルに直接アクセスする必要があるのに対し、LSIはエンコーダ、デコーダ、潜在SIモデルをエンドツーエンドで最適化する。
  • この手法は連続時間の定式化に基づき、共同学習のための原理的なEvidence Lower Bound(ELBO)目的関数を導出している。
  • 潜在空間で動作することで、高次元の観測データ上にSIを直接適用する際の計算負荷を抑えつつ、SIの生成的柔軟性は維持する。
  • 大規模なImageNet生成ベンチマークで広範な実験を行い、LSIの有効性を示している。

要旨: Stochastic Interpolants(SI)は生成モデリングのための強力な枠組みであり、2つの確率分布間を柔軟に変換することができます。しかし、結合最適化された潜在変数モデルにおいてSIを用いることは未だ検討されていません。これは、2つの分布からのサンプルに直接アクセスする必要があるためです。本研究では、潜在空間においてエンドツーエンドで最適化されたエンコーダ、デコーダ、潜在SIモデルを用いて共同学習を可能にする Latent Stochastic Interpolants(LSI)を提案します。連続時間に直接導出される、原理に基づく Evidence Lower Bound(ELBO)目的関数を開発することでこれを実現します。共同最適化により、LSIは、エンコーダにより定義された集約事後分布へと任意の事前分布を変換する生成過程とともに、有効な潜在表現を学習することができます。LSIは、通常の拡散モデルの単純な事前分布を回避し、高次元の観測空間にSIを直接適用する際の計算負荷を軽減しつつ、SI枠組みの生成上の柔軟性を保持します。標準的な大規模ImageNet生成ベンチマークに関する包括的な実験により、LSIの有効性を示します。