タンパク質条件付きマルチ目的強化学習による全長mRNA設計

arXiv cs.LG / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本研究では、治療用mRNAの安定性、翻訳効率、免疫安全性に関わる複数の要件をバランスさせつつ、標的タンパク質配列から全長mRNAをデノボ生成するマルチ目的フレームワーク「ProMORNA」を提案している。
ProMORNAは、6百万件超の自然なタンパク質–mRNAペアで学習したBART型のエンコーダ–デコーダモデルを基盤としており、タンパク質から転写産物を生成する能力を獲得している。
複数の生物学的目的を同一の枠組みで同時に最適化するために、「Multi-Objective Group Relative Policy Optimization（MO-GRPO）」を導入している。
事例として、ファイアフライ・ルシフェラーゼを学習データとプロンプトプールの両方から除外した未見標的として評価したところ、標準的な教師ありベースラインに比べて、予測半減期と翻訳効率のin silicoパレートフロンティアが改善した。
同一の評価パイプライン下で、別の最先端ベースラインよりも高い予測機能スコアも達成しており、全長mRNA設計においてマルチ目的強化学習が未見ターゲットへ一般化できる可能性を示している。

要旨: 治療用メッセンジャーRNA（mRNA）の設計には、安定性、翻訳効率、免疫安全性のバランスを慎重に取りながら、完全長転写産物を作り出すことが必要です。この課題に対処するために、我々はProMORNAを提案します。ProMORNAは、目標となるタンパク質配列から直接、完全なmRNA転写産物を extit{de novo}で生成する、多目的生成フレームワークです。本手法は、6百万件超の天然のタンパク質-mRNAペアを用いて、BARTスタイルのエンコーダ・デコーダモデルを学習することから始まります。次に、複数目的グループ相対ポリシー最適化（Multi-Objective Group Relative Policy Optimization; MO-GRPO）を導入し、統一的な方法でさまざまな生物学的目的を同時に最適化します。事例研究として、広く用いられているホタルルシフェラーゼの標的についてProMORNAを評価しました。ここでは、これを我々の教師あり学習データおよびプロンプトプールの両方から除外しました。その結果、ProMORNAは、標準的な教師ありベースラインに対して、予測される半減期と翻訳効率に関する extit{in silico}パレートフロンティアを改善することが示されました。さらに、同一の評価パイプラインの下で、最先端のベースラインよりも高い予測機能スコアを達成しました。これらの計算による知見は、未見の標的に対する完全長mRNA設計において、多目的強化学習を用いることの実現可能性を示しています。