単一細胞RNAシーケンシングデータに対する補完(imputation)手法の大規模比較分析

arXiv cs.LG / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • scRNA-seq のドロップアウトによるゼロのスパース性が分布を歪め、下流解析を損なうため、これを補正する imputation 手法の比較が課題になっていたと述べている。
  • 著者らは、従来型〜DLベースまで 15 手法(7カテゴリ)を 30データセット(10プロトコル)・6つの下流タスクで大規模にベンチマークし、包括的な性能評価を提示している。
  • 結果として、モデルベース/平滑化/低ランク行列などの従来手法が、拡散・GAN・GNN・オートエンコーダ等のDL手法より概して優れることを報告している。
  • 数値的な遺伝子発現の回復精度が高くても、生物学的解釈性の向上に必ずしも結びつかないこと、さらにデータセット/プロトコル/タスク依存で成績が大きく変動し、常に最強の単一手法は存在しないことを示している。