がん予後予測のためのグラフ・トランスフォーマーに基づくパスウェイ埋め込み

arXiv cs.LG / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、多様なマルチオミクスデータからがんの進行を予測する課題に取り組み、経路(パスウェイ)表現を作るための遺伝子の符号化方法に焦点を当てています。
  • 提案手法PATHは、患者条件付き(patient-conditioned)のモデュレーションに基づく遺伝子埋め込みで、まず遺伝子ごとの共有ベース埋め込みを用意し、それを患者固有のCNV(コピー数変異)と変異シグナルで動的に調整します。
  • PATHは、経路同士の相互作用を捉えるために経路ガイド付きアテンションを用いるグラフ・トランスフォーマーに統合されています。
  • パンクキャンサーの転移予測でPATHはF1スコア0.8766を達成し、既存のSOTAマルチオミクスベンチマークに対して8.8%の改善を示すだけでなく、生物学的に意味のある経路同定や疾患状態に特有な「経路の組み替え(rewiring)」も明らかにします。

要旨: 患者間で分子オミクスデータの高い異質性が存在するため、がんの進行を正確に予測することは依然として課題である。生物学的知見に基づくモデルはこれらの予測の解釈可能性を向上させてきたが、個々の遺伝子をどのように符号化して経路表現を構築するかという点に、根強い制限がある。既存の階層型モデルでは、通常、遺伝子特徴は生の分子入力を直接写像することで導出される。一方、統合フレームワークでは、多くの場合、患者レベルの信号に対する単純な統計的集約に依存している。これらの手法はしばしば、各遺伝子に対して共有される基底表現を明示的に学習できないため、下流の経路埋め込みの表現力と生物学的精度が制限される。そこで我々は、PATHという、モジュレーションに基づく患者条件付き遺伝子埋め込み戦略を提案する。PATHは、各遺伝子の共有基底埋め込みから出発し、集団内で安定した生物学的アイデンティティを保持した上で、患者固有のコピー数変異(CNV)および変異シグナルを用いてそれを動的に適応させることで、パラダイムシフトを実現する。これにより、遺伝子そのものに対する一貫した潜在的理解を維持しつつ、個々の微細な分子変化を捉えることができる。我々はPATHをグラフ変換器フレームワークに統合し、生物学的に結び付いた経路間の相互作用を、経路ガイド付き注意(attention)によってモデル化する。全がん種にわたる転移予測において、PATHはF1スコア 0.8766 を達成し、既存のSOTAのマルチオミクスベンチマークに比べて8.8パーセントの改善に相当する。予測精度が優れているだけでなく、我々の手法は生物学的に意味のある経路を同定し、さらに重要な点として、疾患状態に特化した経路の再配線(rewiring)を明らかにする。これにより、がんの進行を駆動する、変化する経路間相互作用についての新たな知見が得られる。