要約:
レトロ合成予測は、有機合成における中核的な課題であり、ある生成物分子に対して反応物を予測することを目的とする。
従来、化学者は妥当な結合解離を選択し、それに対応する反応物を導出する。これは時間がかかり、相当な専門知識を必要とする。
近年の分子大型言語モデル(LLMs)の進展により一定の進歩が見られるが、多くの手法は戦略的推論なしに反応物を予測するか、一般的な生成物分析のみを行い、特定の反応物の選択へと論理的につながる結合解離戦略について明示的に推論することはない。
これらの制約を克服するため、化学者の戦略的思考を活用するレトロ合成推論モデル、RetroReasoner を提案する。
RetroReasoner は、監督付きファインチューニング(SFT)と強化学習(RL)の両方を用いて訓練される。
SFT のためには、反応物予測とともに構造化された結合解離の合理的理由を生成するフレームワーク SyntheticRetro を導入する。
RL の場合、往復の正確性を報酬として適用し、予測された反応物を順方向の合成モデルに通し、前方で予測された生成物が元の入力生成物と一致する場合に予測が報われる。
実験結果は、RetroReasoner が従来のベースラインを上回るだけでなく、より広範な実現可能な反応物提案を生成し、特により難しい反応例を扱う場合に有効であることを示している。
RetroReasoner: 戦略的再合成予測のための推論型LLM
arXiv cs.AI / 2026/3/16
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- RetroReasoner は、戦略的再合成予測のための推論型LLMであり、反応物選択における結合切断推論の明示的な必要性に対処します。
- モデルは教師ありファインチューニング(SFT)と強化学習(RL)を組み合わせ、結合切断の推論を反応物予測と対に結びつける SyntheticRetro フレームワークを含みます。
- RL では、前方予測を元の生成物と照合して一貫性を促進する「往復精度報酬」を用います。
- 実験では、従来のベースラインを上回り、特に難易度の高い反応ケースで、実現可能な反応物のより広い集合を生成することが示されています。
