ドナーを考慮したIBD分類のためのscRNA-seqベンチマーク
arXiv stat.ML / 2026/5/6
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、IBDのscRNA-seq疾患分類ではドナーを考慮した交差検証が必須だと主張しており、ランダムに細胞を分割すると擬似反復(pseudoreplication)が生じて性能が過大評価されうる点を示しています。
- ドナーを考慮したベンチマークを、2つの独立したIBDコホート(SCP259の潰瘍性大腸炎とKong 2023のクローン病)で提示し、特徴表現としてCLR組成、GatedStructuralCFN依存埋め込み、scVI潜在埋め込みの3手法を比較します。
- ドナーを考慮した結果としてSCP259で高いAUROCが得られ、Kongコホートでは大腸領域でCFNが線形のCLRを上回る一方、回腸末端では線形モデルが優勢になることが示されます。
- コホート間の転移は非対称で、CD→UCはAUC 0.833と一定の性能を示す一方、UC→CDは偶然に近い結果でした。また、CFNのエッジ安定性は、区画(compartment)で層別した特徴により改善し、グローバル組成に由来する見かけの不安定性を低減します。
- ベンチマークのコードも公開されており、区画を意識した特徴構築が予測精度とモデル構造の解釈性の両方で重要だと結論づけています。



