要約: 酵素の動力学的パラメータを予測することは、定義された生化学条件下で酵素が特定の基質を触媒する効率を定量化します。転換数 (k_\text{cat})、ミカエリス定数 (K_\text{m})、阻害定数 (K_\text{i}) のような標準的なパラメータは、酵素配列、基質の化学的性質、および結合中の活性部位の立体配置適応の共同的依存関係により決まります。多くの学習パイプラインはこの過程を、酵素と基質の静的適合性問題として単純化し、それらの表現を浅い演算で融合し、単一の値を回帰します。こうした定式化は、触媒作用の段階的性質(基質の認識と構造適応の双方を含む)を見落とします。この点において、私たちは動力学予測を段階的な多モーダル条件付きモデリング問題として再定式化し、Enzyme-Reaction Bridging Adapter(ERBA)を導入します。ERBAはタンパク質言語モデル(PLMs)の生化学的事前情報を保持しつつ、ファインチューニングを介してクロスモーダル情報を注入します。ERBAは二段階で条件付けを行います。分子認識クロスアテンション(MRCA)はまず基質情報を酵素表現に注入して特異性を捉え、幾何認識型のMixture-of-Experts(G-MoE)は次に有効部位の構造を統合し、導入された適合を反映するようにサンプルをポケット専用のエキスパートへルーティングします。意味的忠実性を維持するため、Enzyme-Substrate Distribution Alignment(ESDA)は PLM多様体内の分布的一貫性を再現核ヒルベルト空間で強制します。3つの動力学的エンドポイントと複数のPLMバックボーンにわたる実験は、ERBAがシーケンスのみおよび浅い融合ベースラインと比較して一貫した改善と分布外での性能向上をもたらすことを示し、生物学的根拠に基づく拡張可能な動力学予測への道を提供し、補因子、変異、および時間分解能を持つ構造的手掛かりを追加するための基盤を提供します。
基質認識から構造適応までをカバーする酵素動力学パラメータのための多模态タンパク質言語モデル
arXiv cs.CV / 2026/3/16
📰 ニュースModels & Research
要点
- 本論文は、基質情報をタンパク質言語モデルへ注入して動力学パラメータの予測を改善する、二段階の多模態条件付けフレームワークである「Enzyme-Reaction Bridging Adapter(ERBA)」を提案する。
- 分子認識クロスアテンション(MRCA)段階では、基質情報を酵素表現に注入して基質特異性を捕捉する。
- 幾何情報を考慮したMixture-of-Experts(G-MoE)段階では、活性部位の構造を統合し、サンプルをポケット特化の専門家へ振り分けることで誘導適合を反映する。
- Enzyme-Substrate Distribution Alignment(ESDA)は、再現核ヒルベルト空間(RKHS)制約を介してPLMマニフォールド内の分布的一貫性を確保し、意味的忠実性を維持する。
- 3つの動力学的エンドポイントと複数のバックボーンにまたがって、ERBAは一貫した性能向上と、シーケンスのみおよび浅層フュージョンのベースラインと比較してOOD性能が強化されることを示し、補因子・変異・時系列構造情報の追加の土台を築く。



