A Large-Scale Comparative Analysis of Imputation Methods for Single-Cell RNA Sequencing Data
arXiv cs.LG / 3/27/2026
💬 OpinionIdeas & Deep AnalysisModels & Research
Key Points
- scRNA-seq のドロップアウトによるゼロのスパース性が分布を歪め、下流解析を損なうため、これを補正する imputation 手法の比較が課題になっていたと述べている。
- 著者らは、従来型〜DLベースまで 15 手法(7カテゴリ)を 30データセット(10プロトコル)・6つの下流タスクで大規模にベンチマークし、包括的な性能評価を提示している。
- 結果として、モデルベース/平滑化/低ランク行列などの従来手法が、拡散・GAN・GNN・オートエンコーダ等のDL手法より概して優れることを報告している。
- 数値的な遺伝子発現の回復精度が高くても、生物学的解釈性の向上に必ずしも結びつかないこと、さらにデータセット/プロトコル/タスク依存で成績が大きく変動し、常に最強の単一手法は存在しないことを示している。
Related Articles
GDPR and AI Training Data: What You Need to Know Before Training on Personal Data
Dev.to
Edge-to-Cloud Swarm Coordination for heritage language revitalization programs with embodied agent feedback loops
Dev.to
Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to
AI Crawler Management: The Definitive Guide to robots.txt for AI Bots
Dev.to
Data Sovereignty Rules and Enterprise AI
Dev.to