DrugPlayGround：創薬のための大規模言語モデルと埋め込みのベンチマーク

arXiv cs.AI / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、創薬に関連するタスク（物理化学的特性の記述、薬剤の相乗作用、薬剤—タンパク質相互作用など）において、LLM（大規模言語モデル）と埋め込みを客観的にベンチマークすることを目的としたフレームワーク「DrugPlayGround」を導入する。
化学的／生物学的推論の評価と、薬剤分子によって引き起こされる摂動に対する生理学的応答を予測する能力の評価の両方を対象としている。
フレームワークは、モデルの予測の「正確さ」だけでなく、その予測を裏付ける詳細な説明を生成できるように、分野の専門家と統合することを設計している。
さらに、LLMを従来の創薬プラットフォームと比較する客観的な評価が不足している点に取り組むことで、創薬パイプラインの複数段階にわたってLLMの強みと限界を明確化することを目指している。

要旨: 大規模言語モデル（LLM）は創薬研究において台頭しており、仮説生成を加速し、候補の優先順位付けを最適化し、よりスケーラブルで費用対効果の高い創薬パイプラインを可能にすることで、薬物研究のあり方を再構築する前例のない機会を提供しています。しかし現在、従来の創薬プラットフォームに対してLLMが持つ利点と限界を明らかにするための、LLM性能に関する客観的評価が不足しています。この新たに生じている問題に取り組むため、私たちはDrugPlayGroundを開発しました。これは、LLMが生理化学的な薬物特性、薬物の相乗作用、薬物-タンパク質相互作用、さらに薬物分子によって導入される撹乱に対する生理学的応答に関する有意義なテキストベースの記述を生成するためのLLM性能を評価し、ベンチマークするための枠組みです。加えて、DrugPlayGroundは、ドメインの専門家と連携してLLMの予測を正当化するための詳細な説明を提供するよう設計されており、それによってLLMの化学的および生物学的推論能力を検証し、創薬のあらゆる段階においてより広くそれらを最前線で活用することを後押しします。