AI Navigate

EvoFlows: タンパク質工学のための進化的編集ベースのフロー・マッチング

arXiv cs.LG / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • EvoFlows は、タンパク質工学を目的とした可変長のシーケンス対シーケンス型タンパク質モデリング手法で、テンプレートタンパク質配列に対して挿入・欠失・置換を限定的かつ制御可能な回数実行できる。
  • 自己回帰型およびマスク済み言語モデルとは異なり、EvoFlows はどの変異を行うべきかだけでなく、それがどこで発生すべきかも予測します。これは、編集フローを用いて進化的に関連する配列間の変異経路を学習し、関連する天然タンパク質の分布とそれらを結ぶ変異経路を同時にモデル化することによって実現されます。
  • UNIREF および OAS の多様なタンパク質群に対する in silico 評価を通じて、EvoFlows はタンパク質配列分布を、タンパク質工学で一般に用いられる最先端のマスク済み言語モデルと同等の品質で捉えつつ、与えられたテンプレートから非自明で自然らしい変異体をより良く生成する能力を示しています。
  • 本研究は、より制御可能で経路を意識したタンパク質設計のアプローチを示しており、タンパク質工学の将来のワークフローやツールに影響を与える可能性があります。
私たちは、タンパク質工学に特化した、可変長のシーケンス対シーケンス型タンパク質モデリング手法である EvoFlows を紹介します。自己回帰型およびマスク済み言語モデルとは異なり、EvoFlows はテンプレートタンパク質配列に対して、挿入、欠失、置換を限られた回数、かつ制御可能な形で実行します。言い換えれば、EvoFlows はどの変異を行うべきかだけでなく、それがどこで発生すべきかも予測します。私たちのアプローチは、編集フローを活用して、進化的に関連するタンパク質配列間の変異軌跡を学習し、関連する天然タンパク質の分布とそれらを結ぶ変異経路を同時にモデル化します。UNIREF および OAS からの多様なタンパク質群に対する広範な in silico 評価を通じて、EvoFlows は、タンパク質工学で一般に用いられる最先端のマスク済み言語モデルと同等の品質でタンパク質配列分布を捉える一方、与えられたテンプレートタンパク質から非自明で自然らしい変異体をより良く生成する能力を示しています。