MolClaw:階層的スキルを備えた自律エージェントによる創薬分子の評価・スクリーニング・最適化

arXiv cs.AI / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • MolClawは、複雑なマルチステップのツール手順をうまく統合できないAIエージェントの課題に焦点を当てた、創薬分子の評価・スクリーニング・最適化のための自律型AIエージェントとして提案されました。
  • システムは30件超のドメイン資源を、3層の階層スキル設計(全70スキル)で統合します。具体的には、(1) 原子的操作のツールレベル、(2) 品質チェックとリフレクション付きで検証されたパイプラインを組み立てるワークフローレベル、(3) すべてのシナリオで計画と検証を支える科学原理のディシプリンレベルです。
  • 分子スクリーニング、最適化、エンドツーエンド探索を扱うMolBenchも提示されており、8〜50回超の連続したツール呼び出しが必要な課題が含まれます。
  • MolClawは複数の指標で最先端の性能を達成したとされ、アブレーション研究では改善が主に「アドホックなスクリプト」ではなく「構造化されたワークフローオーケストレーション」から生まれることが示されました。
  • この研究は、高複雑性シナリオにおけるAI主導の創薬の性能を最も制約するボトルネックとして、ワークフローオーケストレーションを特定しています。

要旨: 計算創薬、特に薬物分子のスクリーニングと最適化という複雑なワークフローには、多段階のワークフロー上で多数の専門ツールをオーケストレーションすることが必要ですが、現在のAIエージェントは、このような高複雑性の状況下で堅牢な性能を維持し続けることや、一貫して十分に高い性能を発揮することに苦戦しています。ここで、薬物分子の評価、スクリーニング、最適化を主導する自律エージェントであるMolClawを提示します。MolClawは、3層の階層的スキルアーキテクチャ(全70スキル)を通じて、30以上の専門領域リソースを統合し、実行時のエージェントの長期的な対話を促進します。すなわち、ツールレベルのスキルは原子レベルの操作を標準化し、ワークフローレベルのスキルは品質チェックとリフレクションを備えた検証済みパイプラインへとそれらを組み立て、さらに、ディシプリン(学問領域)レベルのスキルは、当該分野のあらゆるシナリオにわたる計画と検証を統治する科学的原理を提供します。加えて、分子スクリーニング、最適化、エンドツーエンドの探索課題から成るベンチマークであるMolBenchを導入します。これは、8〜50+に及ぶ連続したツール呼び出しを含む挑戦で構成されています。MolClawは、すべての評価指標において最先端の性能を達成し、アブレーション研究により、獲得された改善が、構造化されたワークフローを必要とする課題に集中し、アドホックなスクリプトで解けてしまう課題では改善が消失することが確認されます。これにより、AI駆動型創薬における主要なボトルネックが、ワークフローオーケストレーション能力であることが示されます。