VQ-SAD:分子生成のためのベクトル量子化構造対応拡散
arXiv cs.AI / 2026/5/4
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、1ホット符号化だけに頼らず、分子の記号的情報を取り入れる拡散ベースの分子生成手法「VQ-SAD」を提案している。
- VQ-SADはVQ-VAEで原子タイプと結合タイプの離散潜在表現を学習し、事前学習済みモデルのVQコードブックを下流の拡散過程におけるトークナイザとして用いる。
- 原子と結合のコードをトークンとして扱うことで、連続埋め込みでの情報損失や、フィンガープリント由来のハッシュ衝突といった問題を回避することを狙っている。
- VQ-SADは、学習可能な前向き拡散過程を備えたニューロ記号(neuro-symbolic)モデルであり、大きな離散コード空間により原子・結合タイプ間のデノイジングのバランスを改善するとしている。
- QM9およびZINC250kでの実験では、提案手法内のVQ-VAEが拡散ベース分子生成の先行手法をわずかに上回ることが示されている。
