大型言語モデルと生物医学知識グラフの融合による、メカニズムに根ざした治療優先順位付け

arXiv cs.AI / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文では、メカニズムに基づく推論のための大型言語モデル(LLM)と生物医学知識グラフを組み合わせ、治療(主にドラッグ・リポジショニング)の優先順位付けを行うハイブリッド手法「DrugKLM」を提案しています。
  • ベンチマークデータセットで、DrugKLMは知識グラフのみ、言語モデルのみのベースライン、およびTxGNNを含む手法より高い性能を示したと報告されています。
  • DrugKLMの信頼度スコアは分子表現型と機能的に整合しており、高スコアは12のTCGAがんにおける生存改善と関連する転写シグネチャと結び付くとされています。
  • この手法は、歴史的に“よく知られた適応”パターンよりも、より生物学的に意味のある撹乱(生物学的摂動)に関する証拠を優先して捉えると主張されています。
  • さらに5つのがんでの専門家キュレーションにより、DrugKLMの優先順位付け挙動が疾患固有の臨床文脈に応じて体系的に異なることが示されています。

Abstract

創薬の転用(ドラッグ・リポジショニング)はしばしば候補同定タスクとして位置づけられますが、既存のアプローチは、過去に広く関連付けられてきたものではなく、生物学的にもっともらしい候補を見分けるための十分な指針を提供していません。ここでは、DrugKLM を導入します。DrugKLM は、バイオメディカル知識グラフの構造と、大規模言語モデルに基づく機序(メカニズム)推論を統合したハイブリッド・フレームワークであり、機序に裏付けられた治療優先度付けを可能にします。ベンチマークデータセットにおいて、DrugKLM は知識グラフのみ、言語モデルのみのベースライン(TxGNN を含む)を上回ります。想起(リコール)の改善に加えて、DrugKLM の信頼度スコアは分子表現型(モレキュラー・フェノタイプ)と機能的に整合しています。具体的には、スコアが高いほど、12 種類の TCGA がんにおいて生存率の改善と関連する転写シグネチャに結びつきます。スコアリングの枠組みは、歴史的な表示(指示)パターンよりも、生物学的な撹乱(摂動)に関するシグナルを優先的に捉えます。5 種類のがんにわたる専門家によるキュレーションでは、さらに、優先度付け行動における体系的な違いが明らかになり、DrugKLM は、首尾一貫した機序的根拠と疾患固有の臨床的文脈によって支えられた候補を引き上げます。これらの結果により、DrugKLM は、異種のバイオメディカルデータを、機序として解釈可能で臨床的に裏付けられた治療仮説へと変換する、エビデンス統合型のフレームワークとして確立されます。