AI Navigate

タンパク質工学のためにマスクド言語モデルを最大限活用する方法

arXiv cs.LG / 2026/3/12

📰 ニュースTools & Practical UsageModels & Research

要点

  • 本論文は、設計過程でタンパク質の性質を最適化するための、マスクド言語モデル(MLM)向けの確率的ビーム探索サンプリング手法を提案します。
  • MLMが全体の1編集近傍の疑似パープレキシティを評価することの高い効率性を活用して、複数の目的を考慮した生成を導く。
  • 生成を全シーケンス評価として再定義することで、タンパク質設計中の柔軟な多目的最適化を可能にします。
  • 抗体設計のin vitro比較実験は、サンプリング手法の選択がモデル自体と同等の影響力を持つことを示しており、今後の研究の重要な領域を強調しています。
要旨: 近年、タンパク質言語モデルが数多く公開されています。 しかし、それらから最適なサンプリングを行い、望ましい生物学的特性を最適化する方法については、比較的少ない研究しか行われていません。 本研究は、マスクド言語モデル(MLM)向けの柔軟で効果的なサンプリング手法を提案し、実際の抗体治療薬キャンペーンを対象として、計算機上およびin vitroの両方でモデルと手法を体系的に評価することによってこのギャップを埋めます。 第一に、確率的ビームサーチを用いたサンプリングを提案します。MLMがシーケンス全体の1回の編集近傍の疑似パープレキシティを評価するのに非常に効率的であるという事実を活用します。 生成を全シーケンス評価の観点で再定義することで、複数の最適化目的に対して柔軟な指針を提供します。 次に、抗体設計の設定におけるin vitroの広範な直接比較評価の結果を報告します。 この結果は、サンプリング手法の選択が用いられるモデルと同等、あるいはそれ以上の影響力を持つことを明らかにしており、未開拓の領域に対する今後の研究を推進します。