要旨:計算病理学は近年著しい進歩を遂げ、基礎的な疾病理解と臨床で利用可能なツールの両方の進歩を促しています。この進化は、デジタル化されたスライドの大量入手と、専門的な深層学習手法およびモデルの利用可能性によって推進されています。複数の自己教師付き基盤特徴抽出器が開発され、細胞分割から腫瘍サブタイプ分類、生存分析に至る下流の予測的応用を可能にしています。一方、組織病理学のために特に設計された生成型基盤モデルは依然として不足しています。そのようなモデルは、特徴抽出器の能力を超えるタスク、例えば仮想染色のような課題に対処できる可能性があります。本論文では、最先端の基盤潜在拡散モデルであるCytoSynを紹介します。広範なベンチマークで示されるように、高度に現実的で多様な病理組織のH&E染色画像を誘導生成する機能を備えています。方法論の改善、訓練データセットの規模拡大、サンプリング戦略、およびスライドレベルの過学習を検討し、改良版CytoSyn-v2を完成させ、最先端モデルPixCellと詳しく比較しました。この比較は、JPEG圧縮のような前処理特有の詳細に対して、拡散モデルと性能指標の両方が強く感度を示すことを強調しました。我々のモデルは、32種類の異なるがんタイプのTCGA診断全スライド画像を10,000枚を超えるデータセットから得て訓練されています。腫瘍学用スライドのみに基づいて訓練されたにもかかわらず、炎症性腸疾患の画像を生成する最先端の性能を維持しています。研究コミュニティを支援するため、CytoSynの重み、訓練および検証データセット、そして合成画像のサンプルをこのリポジトリに公開します: https://huggingface.co/Owkin-Bioptimus/CytoSyn
CytoSyn: 組織病理学の基盤拡散モデル -- 技術報告
arXiv cs.CV / 2026/3/20
📰 ニュースTools & Practical UsageModels & Research
要点
- CytoSyn は、組織病理学のために設計された最先端の基盤潜在拡散モデルとして導入され、高品質でリアルな H&E 染色画像のガイド付き生成を実現します。
- 本研究は、手法の改善、訓練セットのスケーリング、サンプリング戦略を提示し、スライドレベルの過適合に対処しており、CytoSyn-v2 と PixCell への詳細な比較を提示します。
- CytoSyn は、32 種類の癌を含む TCGA の診断用全スライド画像を1万枚超で訓練され、著者らは強いドメイン横断的一般化を観察しています。腫瘍スライドのみで訓練されたにもかかわらず、炎症性腸疾患の画像を生成することができる点を含む、クロスドメイン一般化が確認されています。
- 学術コミュニティを支援するため、著者らは CytoSyn の重み、訓練/検証データセット、そして HuggingFace 上の合成画像サンプルを公表しています。




