多段階代謝経路設計のための計算フレームワーク

arXiv cs.LG / 2026/4/16

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、深層学習と従来のレトロバイオシンセシス(逆合成生物合成)ワークフローを組み合わせることで、多段階のde novo(新規)代謝経路設計のための計算フレームワークを提案する。
  • 公開されている代謝反応および酵素テンプレートのデータベースから学習データセットを構築し、さらに酵素反応テンプレートを用いて人工反応を生成してデータを拡張する。
  • 1ステップ経路および2ステップ経路の候補について妥当性をスコアするために、2つのニューラルネットワークベースのランキングモデルを二値分類器として学習する。
  • これらのモデルを、酵素テンプレートを用いた多段階レトロバイオシンセシスのパイプラインに統合し、計算機上で選択した天然および非天然の代謝経路を再現することで検証を示す。

Abstract

シリコン(in silico)ツールは、新規の仮説を生成し、de novo代謝経路設計において代替案を探索するうえで重要である。しかし、レトロバイオ合成(retrobiosynthesis)に対して多くの計算フレームワークが提案されている一方で、アルゴリズムに導かれた外来(xenobiotic)生化学的レトロ合成について、文献上で成功例が報告されたことはほとんどない。有機化学分野の応用では、深層学習によって合成およびレトロ合成の品質が向上している。この進歩に触発され、化学的変換の深層学習と従来のレトロバイオ合成ワークフローを組み合わせ、シリコン上での合成的代謝経路設計を改善することを検討した。我々の計算的な生合成経路設計フレームワークを開発するために、公的データベースから代謝反応および酵素テンプレートのデータを集約した。文献から適応したデータ拡張手順を実施し、酵素反応テンプレートによって生成された人工の代謝反応によって、集約した反応データセットを充実させた。2つのニューラルネットワークベースの経路ランキングモデルを、二値分類器として訓練し、集約された反応と人工の対応物を区別した。各モデルは、1ステップ経路または2ステップ経路の妥当性を定量化するスカラーを出力する。これら2つのモデルと酵素テンプレートを組み合わせることで、多段階のレトロバイオ合成パイプラインを構築し、いくつかの自然および非自然の経路を計算機上で再現することで検証した。