VQ-SAD:分子生成のためのベクトル量子化構造対応拡散

arXiv cs.AI / 2026/5/4

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、1ホット符号化だけに頼らず、分子の記号的情報を取り入れる拡散ベースの分子生成手法「VQ-SAD」を提案している。
  • VQ-SADはVQ-VAEで原子タイプと結合タイプの離散潜在表現を学習し、事前学習済みモデルのVQコードブックを下流の拡散過程におけるトークナイザとして用いる。
  • 原子と結合のコードをトークンとして扱うことで、連続埋め込みでの情報損失や、フィンガープリント由来のハッシュ衝突といった問題を回避することを狙っている。
  • VQ-SADは、学習可能な前向き拡散過程を備えたニューロ記号(neuro-symbolic)モデルであり、大きな離散コード空間により原子・結合タイプ間のデノイジングのバランスを改善するとしている。
  • QM9およびZINC250kでの実験では、提案手法内のVQ-VAEが拡散ベース分子生成の先行手法をわずかに上回ることが示されている。

Abstract

多くの拡散ベースの分子生成手法では、分子の記号的情報を無視し、原子種と結合種をワンホット表現として表します。モルガン指紋に基づく手法ではハッシュ衝突が起きやすく、情報損失なしに連続空間へ埋め込むことが難しいうえ、ランダムな指紋は有効な分子に対応しません。この問題を回避するために、我々は別のパラダイムを用い、原子コードと結合コードをVQ-VAEの潜在変数として扱います。VQ-SADを提案します。VQ-SADはまずVQ-VAEを学習し、凍結した事前学習済みのVQ-VAEモデルを利用して、原子種と結合種の両方のコードブックを、下流の拡散プロセスにおけるトークナイザとして考えます。VQ-SADはニューロ記号モデルであり、学習可能な前向きプロセスを備えた拡散ベースのモデルに対して、記号的情報とニューラルな構造情報の両方を活用します。大規模な離散コード空間により、原子種と結合種のバランスがより良くなり、これがノイズ除去(デノージング)プロセスを強化します。VQ-VAEは、QM9およびZINC250kデータセットにおける拡散ベースの分子生成で、SOTAモデルをわずかに上回ります。