データが限られた空間トランスクリプトミクスにおける遺伝子発現予測の改善のための、中央から局所への適応的生成拡散フレームワーク
arXiv cs.LG / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、データが極端に乏しい状況下で空間トランスクリプトミクスから遺伝子発現予測を改善するための、中央から局所への適応的生成拡散フレームワークであるC2L-STを提案する。
- 大規模な病理組織データセットでグローバルな中央拡散モデルを事前学習し、転移可能な形態学的事前情報を学習した後、少数の対応する画像–遺伝子スポットから得られる軽量な遺伝子条件付きモジュレーションにより、施設(機関)固有の局所モデルへ適応させる。
- 本手法は、見た目および構造として現実的であると同時に、分子レベルでも整合する合成病理組織パッチを生成し、複数の臓器にわたって埋め込み空間で実データとの強い重なりを示す。
- 合成の画像–遺伝子対を下流の学習に用いると、限られたサンプルスポットのほんの一部しか使用しないにもかかわらず、遺伝子発現予測の精度と空間的な一貫性が、ほぼ実データ同等の性能まで向上する。
- 総じて、C2L-STは、空間生物学において病理組織とトランスクリプトミクスをより良く統合しながら、分子レベルのデータ拡張を実現するスケーラブルでデータ効率の高いアプローチとして提示される。



