広告

病理組織画像と多目的パッチ選択を用いたPAM50サブタイプ分類のためのディープラーニング・パイプライン

arXiv cs.CV / 2026/4/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、H&Eの全スライド画像からPAM50の腫瘍固有サブタイプを直接予測するための、最適化駆動型のディープラーニング枠組みを提示しており、高価な分子アッセイへの依存を低減することを目的としている。
  • 情報量、空間的多様性、不確実性、パッチ数のバランスを取りながら、使用する病理組織パッチを共同で最適化する。具体的には、多目的選択にNSGA-IIを用い、不確実性推定にはモンテカルロドロップアウトを組み合わせている。
  • ResNet18のバックボーンに、カスタムCNN分類ヘッドを用いる。手法は、網羅的なサンプリングに依存するのではなく、少数だが高い情報量を持つパッチの集合を見出すことを設計思想としている。
  • 実験では、内部のTCGA-BRCAデータセット(627 WSIs)で学習し、外部のCPTAC-BRCAデータセットで検証を行った。内部でF1/AUCは0.8812/0.9841、外部で0.7952/0.9512を達成している。
  • 著者らは、このアプローチが計算効率を改善し、臨床的意思決定の可能性を見据えた、スケーラブルな画像ベースのPAM50分類の実現可能性を支えると主張している。

要旨: 乳がんは分子プロファイルが多様で、非常に不均一な疾患である。PAM50遺伝子シグネチャは、乳がんを内在的サブタイプに分類するための標準として広く認知されており、よりパーソナライズされた治療戦略を可能にする。本研究では、H&E染色の全スライド画像(WSI)からPAM50サブタイプを直接予測することで、高価な分子アッセイへの依存を低減することを目指した、新しい最適化駆動型の深層学習フレームワークを提案する。提案手法では、非劣解ソート遺伝的アルゴリズムII(NSGA-II)と、モンテカルロドロップアウトに基づく不確実性推定を組み合わせることで、パッチの情報量、空間的多様性、不確実性、ならびにパッチ数を同時に最適化する。提案手法は、分類に有効な小規模かつ高情報量のパッチ部分集合を同定できる。特徴抽出にはResNet18バックボーンを用い、分類にはカスタムCNNヘッドを用いた。評価のため、学習コホートには内部のTCGA-BRCAデータセットを用い、テストコホートには外部のCPTAC-BRCAデータセットを用いた。内部データセットでは、TCGA-BRCAコホートの627枚のWSIを用いて、F1-scoreが0.8812、AUCが0.9841を達成した。外部検証データセットにおける提案アプローチの性能は、F1-scoreが0.7952、AUCが0.9512であった。これらの結果は、提案する最適化に導かれ、不確実性を考慮したパッチ選択が、既存手法と比較して高い性能を達成し、病理組織に基づくPAM50分類の計算効率を向上できることを示しており、スケーラブルな画像ベースの置換として、臨床的意思決定を支援する可能性があることを示唆している。

広告