AI Navigate

scGPTにおける造血マニフォールドの発見は、生物学的ファウンデーションモデル内部から高性能アルゴリズムを抽出する手法を生み出す

arXiv cs.LG / 2026/3/12

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、機構的解釈性を通じて、単一細胞ファウンデーションモデルscGPTからコンパクトな造血アルゴリズムを発見・抽出したことを報告する。
  • scGPTは内部で発生分岐構造を持つ造血マニフォールドを符号化しており、非重複のTabula Sapiensパネルで検証され、独立した多献者免疫パネルへ転送可能であることが示されている。
  • 著者らは、凍結されたアテンション重みからの直接オペレータエクスポート、軽量アダプター、タスク特異的リードアウトという一般的な3段階抽出法を提示し、ターゲットデータセットへの再訓練を行うことなく単独のアルゴリズムを生み出す。
  • scVI、Palantir、DPT、CellTypist、PCA、およびベースラインとの広範なベンチマークにおいて、抽出頭は最良の擬似時間深度順序を達成し、主要サブタイプエンドポイント(CD4/CD8 AUROC 0.867、単球/マクロファージAUROC 0.951)をリードする。訓練可能パラメータを約1000分の1に削減しつつ34.5倍高速で、3つのアテンションヘッドから単一ヘッドへ圧縮し、さらにランク-64のサロゲートへと圧縮できる一方で、性能を維持する。
本文: arXiv:2603.10261v1 発表タイプ: new 要旨: 私たちは、単一細胞ファウンデーションモデルscGPTからコンパクトな造血アルゴリズムを発見・抽出したことを報告します。機構的解釈性を介してファウンデーションモデルから抽出された、これまでで初めて生物学的に有用で競争力のあるアルゴリズムであると考えられます。scGPTは内部に有意な発生分岐構造を持つコンパクトな造血マニフォールドを符号化しており、厳密な非重複のTabula Sapiens外部パネルで検証され、凍結頭を用いたゼロショット転送を介して独立した多献者免疫パネルへ転送可能であることが確認された。この幾何を分離するために、凍結された注意重みからの直接オペレータエクスポート、軽量な学習済みアダプター、タスク特異的リードアウトからなる一般的な3段階の抽出法を導入し、ターゲットデータセットでの再訓練を伴わない単独アルゴリズムを生み出します。88分割のドナー保持ホールドアウトベンチマークにおいて、抽出アルゴリズムは最も強力な擬似時間深度順序を達成し、主要なサブタイプエンドポイント(CD4/CD8 AUROC 0.867、単球/マクロファージAUROC 0.951)をリードします。3層MLPを用いた凍結済みscGPT埋め込みの標準的なプロービングと比較して、抽出頭は6/8の分類エンドポイントで有意に優れており、全12分割評価キャンペーンを34.5倍の速さで完了し、訓練可能パラメータを約1000倍減らしています。エクスポートされたオペレーターは、3つの統合アテンションヘッドから単一ヘッドへ統計的に有意な損失を伴わずに圧縮され、さらにランク64のサロゲートへと圧縮されていきます。機構的解釈性は、コンパクトオペレーターの4因子核がアブレーション影響の66.2%を説明することを明らかにし、それらの因子は明示的なT/リンパ系、B/形質細胞系、顆粒球系、単球/マクロファージ遺伝子プログラムへと分解される。補足的な第二マニフォールド検証(細胞間コミュニケーションの幾何学)は、抽出法が造血以外にも一般化することを確認します。