概要: 多様な生物学的および技術的条件にまたがって単一細胞の遺伝子発現をモデル化することは、細胞状態の特定や未観測の状況をシミュレートするうえで重要です。既存の手法の多くは遺伝子を独立したトークンとして扱うため、遺伝子に備わる高レベルの生物学的な関係性を見落とし、その結果として性能が低下します。そこで本研究では、多条件の単一細胞モデリングのための条件付きTransformerに基づく統一的な生成フレームワークであるSAVEを提案します。SAVEは、意味的に関連する遺伝子をブロックにまとめることで粗視化表現を活用し、遺伝子モジュール間のより高次の依存関係を捉えます。さらに、フローマッチング機構と条件マスキング戦略により、柔軟なシミュレーションが強化され、未観測の条件の組み合わせにも対応できる汎化が可能になります。SAVEは、条件付き生成、バッチ効果補正、摂動予測を含む一連のベンチマークで評価します。SAVEは一貫して、生成の忠実性と外挿的な汎化において最先端手法を上回り、特に低リソース環境や組合せ的にホールドアウトされた設定において優れています。総合的に、SAVEは複雑な単一細胞データをモデル化するためのスケーラブルで汎化可能な解決策を提供し、バーチャル細胞合成や生物学的解釈に幅広く役立ちます。コードは公開されています: https://github.com/fdu-wangfeilab/sc-save
SAVE:遺伝子ブロック・アテンションによる多条件単一細胞生成のための汎用的フレームワーク
arXiv cs.AI / 2026/4/21
📰 ニュースTools & Practical UsageModels & Research
要点
- SAVEは、条件付きTransformerを用いて多条件の単一細胞における遺伝子発現を生成するための、汎用的な生成フレームワークを提案しています。
- 遺伝子を独立したトークンとして扱うのではなく、SAVEは意味的に関連する遺伝子をブロックにまとめ、遺伝子モジュール間の高次の依存関係を捉える「遺伝子ブロック・アテンション」を用います。
- Flow Matchingメカニズムと条件マスキング戦略により、柔軟なシミュレーションと、見たことのない条件の組み合わせへの一般化が可能になります。
- 条件付き生成、バッチ効果補正、摂動予測といった複数のベンチマークで、SAVEは生成の忠実度と外挿的な一般化において最先端手法を一貫して上回り、特に低リソースや組合せ的に未観測の設定で優位です。
- 著者はGitHubでコードを公開しており、再現性と、バーチャル細胞合成や生物学的解釈に向けた普及を後押しします。




