Saccharomyces cerevisiaeにおけるバイオ燃料関連バイオマス生産の予測と最適化のための、統合的なゲノムスケール代謝モデリングおよび機械学習フレームワーク

arXiv cs.LG / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究では、Yeast9のゲノムスケール代謝モデルに機械学習と最適化を統合し、グルコース、酸素、アンモニウム条件が異なるもとでSaccharomyces cerevisiaeのバイオマスフラックスを予測し、改善するための計算フレームワークを提案する。
  • 2,000件のシミュレーションされたフラックスプロファイルを用いることで、Random ForestおよびXGBoost回帰器は非常に高い予測性能(R2 ≈ 0.9999および0.9990)を達成し、フラックスの正確な予測を可能にした。
  • バリアーショナルオートエンコーダ(VAE)が4つの代謝クラスターを同定し、さらにSHAPベースの解釈可能性により、解糖系、TCA回路、脂質生合成がバイオマス生産の主要な決定因子であることが示された。
  • 著者らは実用的なin silico最適化の結果を報告している。in silicoでの過剰発現によりバイオマスフラックスが0.979 gDW/hrまで改善し、栄養制約に対するベイズ最適化によってバイオマスフラックスが最大で約12倍(0.0858〜1.041 gDW/hr)にまで増加した。
  • さらに生成的敵対的ネットワーク(GAN)は、シミュレーション妥当性と生成的探索を組み合わせることで、バイオ燃料関連バイオマス工学に関連する新しい、かつ化学量論的に実行可能なフラックス構成を提案する。

Abstract

Saccharomyces cerevisiae は産業バイオテクノロジーにおける基盤となる微生物であり、その遺伝学的操作の容易さと、強固な発酵能力によって高く評価されています。多様な環境および遺伝的攪乱にわたってバイオマスフラックスを正確に予測することは、合理的な株設計にとって依然として大きな課題です。本研究では、Yeast9 のゲノムスケール代謝モデルに機械学習と最適化を組み合わせた計算フレームワークを提示し、バイオマスフラックスの予測、解釈、および強化を行います。フラックスバランス解析により、グルコース、酸素、アンモニウムの取り込み速度を変化させて 2,000 のフラックスプロファイルを生成しました。ランダムフォレストおよび XGBoost の回帰器は、それぞれ R2 が 0.99989 および 0.9990 を達成しました。変分オートエンコーダにより 4 つの異なる代謝クラスターが明らかになり、SHAP 解析によって、解糖系、TCA サイクル、脂質生合成が主要なバイオマス決定因子であることが特定されました。シリコ内過剰発現ではバイオマスフラックス 0.979 gDW/hr を実現し、栄養制約のベイズ最適化により 12 倍の増加(0.0858 から 1.041 gDW/hr)が得られました。生成敵対ネットワークは、化学量論的に実行可能な新規フラックス構成を提案しました。このフレームワークは、ゲノムスケールシミュレーション、解釈可能な機械学習、ならびに生成モデリングを組み合わせることで、酵母の代謝工学をどのように前進させ得るかを示しています。

広告

Saccharomyces cerevisiaeにおけるバイオ燃料関連バイオマス生産の予測と最適化のための、統合的なゲノムスケール代謝モデリングおよび機械学習フレームワーク | AI Navigate