要旨: 大規模言語モデル(LLM)は、多様な情報源や形式からの情報について推論する能力によって、小分子創薬を加速する可能性を持っています。しかし、現実世界の状況を反映するベンチマークが欠如しているため、その実用的な有用性はいまだ不明確です。本研究では、分子特性予測、分子表現の変換、分子設計にまたがる、化学的に裏付けられた一連のタスクを導入します。重要なのは、これらのタスクを強化学習(RL)の環境として定式化し、評価と事後学習(ポストトレーニング)のための統一的なアプローチを可能にする点です。3つのモデル系統において、最先端モデルが化学タスクでますます高い能力を示す一方で、特にデータが少ない実験環境では改善の余地が大きいことを見出しました。決定的なのは、RLに基づく事後学習が性能を大幅に向上させ得ることを示す点です。我々の環境で事後学習したより小さなモデルは、ベースモデルが大幅に弱いにもかかわらず、最先端のフロンティアモデルと競争力を持ちます。これは創薬においてLLMを実際に活用するための実用的な道筋を示唆しています。すなわち、慎重に設計した評価タスクと、狙いを定めた事後学習を組み合わせることで、重要な能力ギャップを解明し、同時に埋めることができます。
大規模言語モデルの能力の進展を小分子創薬に向けて評価する
arXiv cs.LG / 2026/4/20
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本研究は、大規模言語モデルが小分子の創薬を加速し得る一方で、現実の場面を反映するベンチマーク不足により実用性が不明確だと指摘しています。
- 分子の性質予測、分子表現の変換、分子設計を含む「化学的に根拠のある」タスク群を新たに提示し、評価の一貫性のためにそれらを強化学習(RL)環境として定式化しています。
- 3つのモデル系統での実験では、最先端モデルほど化学タスクで高い性能を示すものの、特に低データ条件の実験設定では大きな改善余地が残ることが分かりました。
- 著者らは、RLベースのポストトレーニングにより性能が大幅に向上し、ベースモデルが弱い小型モデルでもポストトレーニング後には最先端モデルに匹敵し得ることを示しています。


