要旨: 細胞状態をモデル化し、摂動への応答を予測することは、計算生物学およびバーチャル細胞の開発における中核的な課題である。単一細胞トランスクリプトミクス向けの既存の基盤モデルは強力な静的表現を提供するが、生成シミュレーションのために細胞状態の分布を明示的にはモデル化しない。ここでは、転写産物状態の分布を学習し、摂動下での条件付きシミュレーションを可能にするマスク付き離散拡散モデルであるLingshu-Cellを導入する。単一細胞トランスクリプトミクスデータの疎で非時系列的な性質と互換性のある離散トークン空間上で直接動作することで、Lingshu-Cellは、遺伝子の選別に基づく事前情報、例えば高い変動性によるフィルタリングや発現レベルによるランキングといった手法に依存せずに、約18,000遺伝子にわたる複雑なトランスクリプトーム全体の発現依存性を捉える。多様な組織および種にわたって、Lingshu-Cellは転写産物分布、マーカー遺伝子の発現パターン、そして細胞サブタイプの割合を正確に再現し、複雑な細胞の不均一性を捉える能力を示している。さらに、細胞型またはドナーの同一性と摂動を共同で埋め込むことで、Lingshu-Cellは、未知の組み合わせとなる同一性と摂動に対する全転写産物レベルの発現変化を予測できる。Virtual Cell Challenge H1の遺伝学的摂動ベンチマークにおいて最先端の性能を達成し、またヒトPBMCにおけるサイトカイン誘導応答の予測でも優れた性能を示す。これらの結果により、Lingshu-Cellは、細胞状態および摂動応答をin silicoでシミュレーションするための柔軟な細胞世界モデルとして確立され、生物学的発見および摂動スクリーニングにおける新たなパラダイムの基盤を築く。
Lingshu-Cell:仮想細胞に向けたトランスクリプトームモデリングのための生成的セルラー・ワールドモデル
arXiv cs.AI / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- Lingshu-Cellは、静的な埋め込みのみを生成するのではなく、単一細胞のトランスクリプトーム状態の分布を学習する生成的セルラー「ワールドモデル」として提示される。
- この手法は、疎で非時系列の単一細胞トランスクリプトームに適した離散トークン空間上で動作する、マスク付き離散拡散モデルを用い、摂動下でのシミュレーションを可能にする。
- 約18,000遺伝子にわたるトランスクリプトーム全体の遺伝子依存性を、一般的な前処理(高可変遺伝子のフィルタリングや発現によるランキングなど)に依存せずにモデル化することを目的としている。
- 複数の組織および種にわたって、本モデルはトランスクリプトーム分布、マーカー遺伝子パターン、細胞サブタイプの比率を再現し、細胞の不均一性を捉えていることを示す。
- 細胞タイプまたはドナーの同一性に加えて摂動で条件付けすることで、Lingshu-Cellは新しい「同一性—摂動」の組み合わせに対するトランスクリプトーム全体の発現変化を予測でき、Virtual Cell Challenge H1およびサイトカイン応答予測ベンチマークで強い性能を達成する。



