DPLM-Evoによる生成的なタンパク質進化マシンに向けて

arXiv cs.LG / 2026/5/4

📰 ニュースModels & Research

要点

  • 本論文は、マスクベースではなく「置換や挿入欠失(indel)の蓄積」によってタンパク質が進化するという直感により合うことを目指した、離散拡散型のタンパク質言語モデル枠組みDPLM-Evoを提案しています。
  • DPLM-Evoは、デノイジング過程で置換・挿入・削除の各編集操作を明示的に予測することで、既存タンパク質のポストエディット/最適化やガイド付き生成の柔軟性を高めます。
  • アップサンプルされた長さの潜在アラインメント空間と、観測される可変長の配列空間を切り離す設計により、indelを考慮した可変長生成を少ない追加計算量で実現します。
  • さらに、文脈依存で生物学的に妥当な突然変異パターンを生成する「文脈化された進化ノイズカーネル」を導入し、置換の現実味を高めます。
  • 実験では、配列理解の向上と、ProteinGymにおける単一配列設定での変異効果予測の最先端性能が示され、可変長の模擬進化や、編集軌跡による既存タンパク質の最適化にも対応できることが報告されています。