GDEGAN: リガンド結合部位予測のためのガウス動的等変グラフアテンションネットワーク

arXiv cs.LG / 2026/3/23

📰 ニュースModels & Research

要点

  • GDEGANは、結合部位予測のために、隣接残基の変動を捉える適応カーネルを用いてドット積注意機構を置換するガウス動的等変グラフアテンションネットワークを導入する。
  • 注意機構は適応的な局所統計を用い、層ごとに近傍統計を計算し、局所分散を適応帯域幅として、ヘッドごとに学習可能な温度を導入して文脈依存の重要性を決定する。
  • COACH420、HOLO4k、PDBBind2020データセット全体で、DCCにおいて37〜66%、DCAにおいて7〜19%の相対的改善を達成し、既存の等変GNN手法を上回った。
  • このアプローチはタンパク質-リガンドドッキングを直接加速し、構造ベース創薬における標的同定を促進する。

要約: 配位子が結合可能な特定のタンパク質の結合部位を正確に予測することは、構造ベースの計算薬物発見における重要なステップです。近年、等変グラフニューラルネットワーク(GNN)は、タンパク質データベースやAlphaFold予測を通じて得られる巨大な3D構造の利活用により、結合部位識別手法の強力なパラダイムとして浮上しています。最先端の等変GNN手法はドット積アテンションを実装しており、隣接残基の化学的および幾何学的性質の変動を無視しています。この変動を捉えるために、GDEGAN(Gaussian Dynamic Equivariant Graph Attention Network)を提案します。これはドット積アテンションを結合部位を認識する適応カーネルに置換します。提案されたアテンション機構は、近傍残基の特徴的な局所特徴分布の統計量を用いて変動を捉えます。私たちの機構は各層で近傍統計を動的に計算し、局所分散を適応的帯域幅パラメータとして用い、学習可能なヘッドごとの温度を持たせることで、各タンパク質領域が文脈特異的な重要度を決定できるようにします。GDEGANは、COACH420、HOLO4k、PDBBind2020データセット全体で、DCCの成功率を37-66%、DCAを7-19%改善し、既存手法を上回ります。これらの進展は、治療標的識別のための潜在的結合部位を特定することにより、タンパク質-リガンドドッキングの加速に直接的に寄与します。