Nested Atoms Model(入れ子状原子モデル)と、大規模単一細胞データのクラスタリングへの応用

arXiv stat.ML / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、グループ・レベルの共変量と観測レベルの共変量の両方を同時にモデル化する必要がある、入れ子/階層構造をもつデータのクラスタリングを対象とする。
  • 動機として OneK1K scRNA-seq データセット(982人、127万細胞)を用い、個人特異的な遺伝子型情報を取り込むことで、細胞と個人の両方をクラスタリングすることを目指す。
  • 著者らは、個人(グループ)レベルと細胞(観測)レベルの不均一性を考慮しつつ、2層のクラスタリングを行うためのベイズ非パラメトリック枠組みである Nested Atoms Model(NAM)を提案する。
  • 高次元のゲノムデータに対してNAMを実用可能にするため、推論のスケーリングを可能にする高速な変分ベイズ推論アルゴリズムを開発する。
  • 実験およびシミュレーションの結果、グループ・レベルの変数を無視する手法よりもNAMが優れていることが示される。さらに OneK1K への適用では、既知の免疫細胞タイプに整合する、均質な細胞タイプのプロファイルをもつ個人クラスターが得られる。