Branching Flows:分離的・連続的・多様体における分岐と削除を伴うマニホールド・フローマッチング

arXiv stat.ML / 2026/4/28

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は「Branching Flows」を提案し、拡散やフローマッチングの考え方に基づいて、単純な分布をデータ分布へ輸送する生成モデルの枠組みを提示しています。
  • 通常のフローマッチング/拡散では状態サイズが固定であることを前提としがちですが、Branching Flowsでは要素を学習された二分木の森の上で確率的に分岐・消滅させることで、生成時に配列(シーケンス)の長さを制御できるようにしています。
  • この手法は、離散集合・ユークリッド空間上の連続領域・滑らかな多様体・それらの混在から成るマルチモーダルな積空間に至るまで、任意のフローマッチング基底プロセスと組み合わせ可能であることが示されています。
  • 実験では小分子生成、抗体配列生成、タンパク質バックボーン生成の3領域で有効性を示し、学習目的の安定性と新しい生成能力を報告しています。

要旨: 生成モデルにおける拡散とフローマッチングのアプローチは、画像生成やタンパク質の折りたたみ・設計のように状態空間が連続である領域、あるいは拡散型の大規模言語モデルに代表されるように離散である領域で有望な結果を示してきました。これらは、状態内の要素数が事前に固定されている場合(例:画像)に自然に適合しますが、例えば大規模言語モデルの応答の長さ、あるいはタンパク質鎖中のアミノ酸数のように、事前には分からない場合には、場当たり的な解決策が必要になります。

ここで我々は、拡散やフローマッチングのアプローチと同様に、単純な分布をデータ分布へ輸送する生成モデリングの枠組みである「分岐フロー(Branching Flows)」を提案します。しかし分岐フローでは、状態の要素は二分木の森(forest)上で進化し、モデルによって学習される率で確率的に分岐し、また消滅します。これにより、生成の過程でモデルが配列中の要素数を制御できるようになります。さらに、分岐フローは、離散集合、連続ユークリッド空間、滑らかな多様体、およびこれらの成分を混ぜ合わせる「マルチモーダル(multimodal)」な積空間上での、任意のフローマッチングのベースとなるプロセスと組み合わせ可能であることも示します。

我々は、3つの領域でこれを実証します:小分子生成(マルチモーダル)、抗体配列生成(離散)、およびタンパク質バックボーン生成(マルチモーダル)です。分岐フローが、安定した学習目的を備えた有能な分布学習器であり、さらに新たな能力を可能にすることを示します。