MolMem:メモリ拡張型のエージェンティック強化学習によるサンプル効率の高い分子最適化

arXiv cs.LG / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • MolMemは、オラクル予算が限られた状況下でのサンプル効率の高い分子最適化を目的とした、メモリ拡張型のマルチターン・エージェンティック強化学習フレームワークである。
  • 本手法は、コールドスタートのための静的なエクゼンプラ(模範)メモリと、成功した軌跡を再利用可能な戦略へ蒸留する進化的なスキルメモリを組み合わせる。
  • MolMemは高コストなロールアウトから得られる長期的な知識が、その後の最適化実行を改善するようにするため、密なステップごとの報酬を用いる。
  • 論文中の実験では、優れた性能が示されている。単一特性タスクで成功率90%(最良のベースラインに対して1.5×)、複数特性タスクでは500回のオラクル呼び出しのみで52%を達成している。
  • 著者らはGitHub上で実装を公開しており、MolMemフレームワークの再現や、さらなる研究の促進を目指している。