Proteo-R1：デノボタンパク質設計のための推論基盤モデル

arXiv cs.LG / 2026/5/6

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

共有:

要点

Proteo-R1は、分子の理解と幾何学的生成を分離する推論ガイド型の新しいタンパク質設計フレームワークとして提案されています。
二重エキスパート構成により、マルチモーダルLLMが配列・構造・テキストを解析して、結合や特異性を左右する重要な機能性残基を特定します。
特定した残基レベルの判断は「ハード制約」として拡散ベースの別の生成エキスパートへ渡され、相互作用アンカーを固定した状態で条件付き共同設計を行います。
連続サンプリングに依存しがちな従来モデルと比べて、解釈可能性・制御性・生化学知識のモジュール的再利用を高めることを目的としています。
コード、データ、デモはプロジェクトサイトで公開されています。

概要:

Deep learningが \emph{de novo} タンパク質設計において原子レベルの精度を達成していることは、しかしながら既存のモデルは依然として大きく非思考的です。既存モデルは、どの残基や相互作用が機能にとって本質的かを明示的に推論することなく、分子の幾何形状を直接合成してしまいます。その結果、設計上の判断が連続的なサンプリング動力学と絡み合い、解釈可能性、制御可能性、そして生化学的知識の体系的な再利用が制限されます。私たちは

Proteo-R1 を導入します。これは

Proteo-R1 は推論に導かれるタンパク質設計の枠組みであり、\emph{分子理解} と \emph{幾何生成} を明示的に切り離します。Proteo-R1 は二重エキスパート構成を採用し、多モーダル大規模言語モデル（MLLM）が \emph{理解のエキスパート}として機能します。これはタンパク質配列、構造、そしてテキスト文脈を解析して、結合と特異性を支配する主要な機能残基を特定します。次に、これらの残基レベルの判断はハード制約として別の拡散ベース \emph{生成のエキスパート}へ渡されます。生成エキスパートは、固定された相互作用アンカーを尊重しつつ、条件付きの共同設計（co-design）を実行します。この因数分解は、人間の専門家が分子工学に取り組む方法を模倣しています。すなわち、まず重要な相互作用について推論し、その制約のもとで幾何を最適化するのです。潜在的なテキスト誘導ではなく、推論を残基レベルの明示的なコミットメントとして実装することで、Proteo-R1 は、LLM推論を最先端の幾何学的生成モデルと安定的で解釈可能かつモジュール化された形で統合することを実現します。コード、データ、デモは https://smiles724.github.io/r1/ で利用可能です。