要約:最近の推論ベースの大規模言語モデル(LLMs)の進展は、複雑な問題解決タスクにおいて大幅な改善を示しています。これらの進展を動機として、いくつかの研究は推論型LLMsを薬物発見や分子設計へ応用することを探究してきました。しかし、既存のほとんどのアプローチは評価に焦点を当てるか、既知の性質改変を持つ分子ペアのような真偽ラベルを必要とする訓練設定に依存しています。そのような監視は、\textit{de novo}分子生成には利用できません。ここでの目的は、事前知識を持たずに望ましさスコアを最適化する新規分子を生成することです。このギャップを埋めるため、私たちは MolRGen を導入します。これは、\textit{de novo}分子生成における推論ベースのLLMsの訓練と評価のための大規模なベンチマーク・データセットです。私たちの貢献は三つです。第一に、\textit{de novo}分子生成と性質予測の評価・訓練のための設定を提案します。第二に、生成された分子の品質と多様性の両方を捉える新しい多様性を考慮したトップ-kスコアを導入します。第三に、私たちの設定は分子生成のためのLLMsを訓練するのにも利用できることを示し、強化学習で24BのLLMを訓練し、その性能と限界について詳しい分析を提供します。
MolRGen: 推論モデルを用いたデノボ分子生成の訓練・評価設定
arXiv cs.LG / 2026/3/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- MolRGenは、デノボ分子生成および性質予測を対象とした、推論ベースのLLMの訓練と評価のための、スケーラブルなベンチマークとデータセットを提案します。
- 生成分子の品質と多様性の両方を捉える、多様性を考慮したTop-kスコアを提案し、評価のギャップを埋めます。
- 本研究は、この設定を用いて分子生成のためのLLMの訓練が可能であることを示しており、強化学習を用いた24Bパラメータのモデルを含む、性能と限界の分析を行っています。
- このフレームワークは、グラウンドトゥルース監督なしでの学習を目指し、既知の高スコア候補が存在しないデノボ設計を可能にするとともに、既存アプローチのギャップを埋めます。

