Abstract
動機: タンパク質バックボーン設計のための生成モデルは、幾何学的妥当性、サンプリング効率、そして長い配列へのスケーラビリティを同時に満たさなければなりません。しかし、既存の多くの手法は、反復的な改良、二次の注意機構、または事後的な幾何学補正に依存しており、その結果として計算効率と構造の忠実性の間に持続的なトレードオフが生じています。
結果: 本研究では、線形時間の推論を可能にしつつ、構築によって厳密な局所共有結合の幾何学を強制する生成モデルである Physics-Informed Mamba(PI-Mamba)を提案します。PI-Mambaは、フローマッチングの枠組みに微分可能な制約強制演算子を統合し、さらにMambaベースの状態空間アーキテクチャと結合します。最適化の安定性とバックボーンの現実味を高めるために、Rouse高分子モデルに由来するスペクトル初期化と、補助的なcis-プロリン認識ヘッドを導入します。ベンチマーク課題全体で、PI-Mambaは局所幾何学違反を0.0\%達成し、高い設計可能性を示しました(scTM = 0.91\pm 0.03, n = 100)。また、単一のA5000 GPU(24 GB)上で、2,000残基を超えるタンパク質にもスケールできます。