BiScale-GTR: マルチスケール分子表現学習のための断片(フラグメント)対応グラフ・トランスフォーマー

arXiv cs.LG / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • BiScale-GTRは、グラフ・トランスフォーマーと組み合わせて使われるGNN主導のハイブリッド・モデルの限界に対処する統一的な自己教師あり分子表現学習フレームワークとして提案される。
  • この手法は、グラフBPEトークン化を改善し、断片を意識したトークン化から得られる、化学的に妥当で高カバレッジな断片トークンを生成する。
  • さらに、並列のGNN–Transformerアーキテクチャを用いる。すなわち、原子レベルのGNN表現を断片埋め込みへプーリングし、断片トークン埋め込みと融合した後、マルチスケール推論のために処理する。
  • 本手法は、局所的な化学環境、部分構造モチーフ、そして長距離依存関係を共同で捉えることで、多粒度な分子パターンを対象とする。
  • MoleculeNet、PharmaBench、LRGBでの実験により、分類・回帰の両方で最先端の結果が報告されており、帰属(attribution)分析から、本モデルが化学的に意味のある機能性モチーフを学習していることが示される。コードは採択後に公開予定。