単一細胞ファウンデーションモデルにおいて中間層が最適な生物学的表現を符号化する

arXiv cs.AI / 2026/4/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、単一細胞ファウンデーションモデルで一般的に行われている「最終層の埋め込みのみを最適な特徴表現として使う」慣行に異議を唱えています。
  • scFoundation(1億パラメータ)とTahoe-X1(13億パラメータ)について、軌跡推定と摂動応答予測の2つのタスクで、層ごとの表現を系統的に評価しました。
  • 軌跡推定では最適層がモデルの深さ60%付近に現れ(最終層より約31%上)、深さと生物学的シグナルの質の関係が単純ではないことが示されました。
  • 摂動応答予測では、T細胞の活性化状態という文脈に応じて最適な抽出層が0〜96%の範囲で大きく変動し、文脈依存性が強いことが分かりました。
  • 不活性(quiescent)細胞では、最初の層の埋め込みがより深い層を上回る場合があり、「階層的な抽象化」という前提が常に成り立つとは限らないことを示唆しています。