要約:
仮想細胞モデルは、単一細胞測定から遺伝的・化学的またはサイトカイン撹乱に対する細胞の反応を予測することによって、インシリコ実験を可能にすることを目指します。実際には、しかし、大規模撹乱予測は三つの連結したボトルネックによって制約されています:非効率な学習および推論パイプライン、高次元のスパース発現空間における不安定なモデリング、再構成のような精度を過度に重視しつつ生物学的忠実度を過小評価する評価プロトコル。
本研究では、上記の制約を共同で対処する、仮想細胞撹乱予測のための専門的な大規模基盤モデル SCALE を提示します。まず、BioNeMo ベースの学習・推論フレームワークを構築し、データスループット、分散スケーラビリティ、デプロイメント効率を大幅に改善し、同等のシステム設定の下で前の SOTA パイプラインに対して事前学習で12.51倍、推論で1.29倍の速度向上を達成します。次に、撹乱予測を条件付き輸送として定式化し、集合を意識したフローアーキテクチャを用いて実装します。これにより、LLaMA ベースの細胞エンコーディングとエンドポイント指向の監督を結合します。この設計は、より安定した学習と撹乱効果のより強い回復をもたらします。第三に、Tahoe-100M に対して、生物学的に意味のある指標を中心とした細胞レベルの厳格なプロトコルを用いて評価します。再構成のみを基準とはしません。このベンチマークで、私たちのモデルは STATE に対して PDCorr を 12.02%、DE Overlap を 10.66% 向上させました。これらの結果は、仮想細胞を前進させるには、より良い生成目的だけでなく、スケーラブルなインフラの共設計、安定したトランスポートモデリング、および生物学的忠実性を重視した評価の共設計が必要であることを示唆しています。
SCALE: スケーラブルな条件付きアトラスレベルのエンドポイント輸送による仮想細胞摂動予測
arXiv cs.LG / 2026/3/19
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- SCALEは、仮想細胞摂動予測のための特化型の大規模基盤モデルであり、学習と推論のボトルネックと評価の忠実度の課題に同時に対処します。
- BioNeMoを基盤とした学習および推論フレームワークを導入し、同一のシステム設定下で従来の最先端と比較して事前学習で約12.51倍、推論で約1.29倍のスピードアップを達成します。
- 摂動予測タスクは、LLaMAベースの細胞エンコーディングをエンドポイント指向の教師信号に結びつけるセット対応のフローを用いた条件付き輸送として定式化され、学習の安定性と摂動回復を改善します。
- Tahoe-100Mデータセットで生物学的に意味のある指標を用いた評価は、STATEに対してPDCorrを12.02%、DE Overlapを10.66%向上させることを示しています。
- 本研究は、仮想細胞モデリングを進展させるために、スケーラブルなインフラ、安定した輸送モデリング、および生物学的に忠実な評価の共同設計を不可欠であると主張します。
関連記事
EU AI Act適合性のために11,529台のMCPサーバをスキャンしました
Dev.to
テックキャリアに4年間も費やしている
Dev.to

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す
THE DECODER
[P] allToall アーキテクチャを用いたデータ並列で 3 台の Mac Minis M4 上で Llama3.2-1B-Instruct の推論! | smolcluster
Reddit r/MachineLearning

NVIDIA V100 32GB が Qwen Coder 30B A3B Q5 で約115トークン/秒を達成
Reddit r/LocalLLaMA