SIGMA:自己回帰的コントラスト学習による、化学言語モデルのための構造不変的生成分子アライメント
arXiv cs.LG / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、文字列ベースの自己回帰的分子生成における重要な課題を扱う。すなわち、同一の分子グラフが複数のトークン列に対応し得るため、線形化の履歴が等価な部分グラフの表現を変えてしまい、潜在的な「軌跡の分岐(trajectory divergence)」が生じる。
- 構造不変的生成分子アライメント(SIGMA)を提案する。線形な文字列表現は維持しつつ、同一の接尾辞に整合する接頭辞同士の潜在状態を、幾何学的/構造的対称性を尊重しながら整列させるためのトークン単位のコントラスト学習目的を用いる。
- 推論効率を向上させ、冗長な探索を避けるために、著者らは同型(isomorphic)ビーム探索(IsoBeam)を提案する。これはデコード中に同型同等な経路を動的に枝刈りする。
- 標準ベンチマークでの実験により、SIGMAが「配列スケーラビリティ」と「グラフ忠実度」のバランスを改善し、多パラメータ最適化において、強力なベースラインに対してサンプル効率と構造多様性をより良く達成することが示される。



