広告

DPD-Cancer:小分子の抗がん活性予測のための説明可能なグラフベース深層学習

arXiv cs.AI / 2026/3/30

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、分類と細胞株固有の増殖阻害(pGI50)を含む、小分子の抗がん活性を予測するためのグラフ注意トランスフォーマーに基づく深層学習フレームワーク「DPD-Cancer」を提案する。
  • 従来の薬剤応答モデルが抱える課題、すなわち、異なるがん細胞株にまたがる分子構造と細胞環境の間の非線形な関係を扱うのが難しい点に対処することを目的としている。
  • pdCSM-cancer、ACLPred、MLASM などの手法とのベンチマークにおいて、DPD-Cancer は強い性能を報告しており、厳密に分割した NCI60 データでは AUC が最大 0.87、ACLPred/MLASM データセットでは最大 0.98 に達する。
  • 10 がん種・73 細胞株における pGI50 予測では、独立したテストセットに対して Pearson 相関が最大 0.72 となる。
  • 本研究は、注意機構を用いて関連する分子部分構造を特定し可視化することで解釈可能性を重視しており、リード最適化のための無償で利用できるウェブサーバも提供する。

Abstract

分子構造と細胞環境の相互作用をモデル化することが難題となり、計算バイオケミストリーにおける正確な薬剤応答予測は重大なボトルネックになっています。がん研究では、腫瘍の不均一性とゲノムの多様性によりこの問題はより深刻で、有効な治療法の同定を妨げます。従来のアプローチでは、多様な細胞株にわたる化学的特徴と生物学的アウトカムの間の非線形な関係を捉えられないことがしばしばあります。そこで本研究では、Graph Attention Transformer(GAT)フレームワークに基づく深層学習手法であるDPD-Cancerを提案します。これは、小分子の抗がん活性の分類と、細胞株特異的な応答の定量的予測、すなわち増殖阻害濃度(pGI50)を対象としています。最先端手法(pdCSM-cancer、ACLPred、MLASM)とベンチマークした結果、DPD-Cancerは優れた性能を示し、厳密に分割したNCI60データでROC曲線下面積(AUC)が最大0.87、ACLPred/MLASMデータセットで最大0.98を達成しました。10種類のがん種と73の細胞株にわたるpGI50の予測では、独立したテストセットにおいて、最大0.72のピアソン相関係数を得ました。これらの結果は、注意(attention)ベースの仕組みが意味のある分子表現の抽出において大きな利点をもたらすことを裏付けており、DPD-Cancerが薬剤候補の優先順位付けにおける競争力のあるツールであることを示します。さらにDPD-Cancerは、注意メカニズムを活用して特定の分子部分構造を特定し可視化することで説明可能性を提供し、リード最適化に向けた実行可能な示唆を与えます。DPD-Cancerは以下で無料で利用できます(Webサーバ): https://biosig.lab.uq.edu.au/dpd_cancer/

広告