VQ-SAD：分子生成のためのベクトル量子化構造対応拡散

arXiv cs.AI / 2026/5/4

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、1ホット符号化だけに頼らず、分子の記号的情報を取り入れる拡散ベースの分子生成手法「VQ-SAD」を提案している。
VQ-SADはVQ-VAEで原子タイプと結合タイプの離散潜在表現を学習し、事前学習済みモデルのVQコードブックを下流の拡散過程におけるトークナイザとして用いる。
原子と結合のコードをトークンとして扱うことで、連続埋め込みでの情報損失や、フィンガープリント由来のハッシュ衝突といった問題を回避することを狙っている。
VQ-SADは、学習可能な前向き拡散過程を備えたニューロ記号（neuro-symbolic）モデルであり、大きな離散コード空間により原子・結合タイプ間のデノイジングのバランスを改善するとしている。
QM9およびZINC250kでの実験では、提案手法内のVQ-VAEが拡散ベース分子生成の先行手法をわずかに上回ることが示されている。

Abstract

多くの拡散ベースの分子生成手法では、分子の記号的情報を無視し、原子種と結合種をワンホット表現として表します。モルガン指紋に基づく手法ではハッシュ衝突が起きやすく、情報損失なしに連続空間へ埋め込むことが難しいうえ、ランダムな指紋は有効な分子に対応しません。この問題を回避するために、我々は別のパラダイムを用い、原子コードと結合コードをVQ-VAEの潜在変数として扱います。VQ-SADを提案します。VQ-SADはまずVQ-VAEを学習し、凍結した事前学習済みのVQ-VAEモデルを利用して、原子種と結合種の両方のコードブックを、下流の拡散プロセスにおけるトークナイザとして考えます。VQ-SADはニューロ記号モデルであり、学習可能な前向きプロセスを備えた拡散ベースのモデルに対して、記号的情報とニューラルな構造情報の両方を活用します。大規模な離散コード空間により、原子種と結合種のバランスがより良くなり、これがノイズ除去（デノージング）プロセスを強化します。VQ-VAEは、QM9およびZINC250kデータセットにおける拡散ベースの分子生成で、SOTAモデルをわずかに上回ります。

Blackstone、Hellman & Friedman、Goldman Sachsとともに新たなエンタープライズAIサービス企業を設立

Anthropic News

三菱電機も出資するユニコーン予備軍東大発新興の燈、フィジカルAI 「26年内に」

日経XTECH

ウーバーCEOダラ・コホロシ（AIで運転手を——そして自分まで—置き換える件）

The Verge

CLMAフレームテスト

Dev.to

「CLAUDE.mdは不要」じゃなくて、実は「いらないのは不適切なルール」

Dev.to

VQ-SAD：分子生成のためのベクトル量子化構造対応拡散

要点

Abstract

関連記事

Blackstone、Hellman & Friedman、Goldman Sachsとともに新たなエンタープライズAIサービス企業を設立

三菱電機も出資するユニコーン予備軍東大発新興の燈、フィジカルAI 「26年内に」

ウーバーCEOダラ・コホロシ（AIで運転手を——そして自分まで—置き換える件）

CLMAフレームテスト

「CLAUDE.mdは不要」じゃなくて、実は「いらないのは不適切なルール」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

Blackstone、Hellman & Friedman、Goldman Sachsとともに新たなエンタープライズAIサービス企業を設立

三菱電機も出資するユニコーン予備軍 東大発新興の燈、フィジカルAI 「26年内に」

ウーバーCEOダラ・コホロシ（AIで運転手を——そして自分まで—置き換える件）

CLMAフレームテスト

「CLAUDE.mdは不要」じゃなくて、実は「いらないのは不適切なルール」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

三菱電機も出資するユニコーン予備軍東大発新興の燈、フィジカルAI 「26年内に」