分子科学のためのマルチタスク大規模推論モデル

arXiv cs.LG / 2026/3/16

📰 ニュースModels & Research

要点

  • 本論文は、分子科学のためのマルチタスク大規模推論モデルを提案し、構造化推論と省察を複数の専門モジュールとチェーン・オブ・ソート(思考過程)フレームワークと統合する。
  • 分子知識を取り入れた強化学習を用い、10の分子タスクと47の指標で改善を示し、基盤アーキテクチャに対して平均50.3%の改善を達成するとともに、リソースの使用量を抑えている。
  • 有効性と解釈性の点で、超大規模パラメータ基盤モデルを含む20以上の最先端ベースラインを上回ると主張している。
  • CNS薬物設計に関するケーススタディは、データ駆動と知識統合アプローチを結ぶ実用的な有用性を示し、知的な分子設計を支援する。
  • 本研究は、明示的な推論機構を埋め込むことが、小規模なモデルにおいて高効率な学習を可能にするという点を主張している。

要旨: 分子科学の人工知能の進歩は、純粋にデータ駆動の予測から知識に基づく計算論的推論へのパラダイムシフトを必要としています。既存の分子モデルは主に独自仕様であり、汎用的な分子知性と一般化能力を欠いています。これは、科学的推論を深層学習アーキテクチャと効果的に統合できる計算手法の必要性を強調します。ここで、構造化された推論と省察を通じて分子科学者の認知プロセスを模倣する、多タスク大規模推論モデルを紹介します。我々のアプローチは、多専門家モジュールを組み込み、さまざまな分子専門知識を提供し、分子知識を織り交ぜた強化学習によって強化された思考の連鎖(CoT)フレームワークを取り入れ、構造化された省察的推論を実現します。10の分子タスクと47の指標にわたる体系的評価は、我々のモデルがベースアーキテクチャを平均で50.3%上回り、超大規模パラメータのファウンデーションモデルを含む20を超える最先端のベースラインを上回った一方で、学習データと計算資源を大幅に抑えていることを示しています。これは、明示的な推論メカニズムを埋め込むことが高効率な学習を可能にし、小規模なモデルが巨大モデルを効率性と解釈性の両面で上回ることができる、ということを検証しています。この計算フレームワークの実用性は、中枢神経系(CNS)薬剤候補の設計に関するケーススタディを通じて検証され、データ駆動と知識統合アプローチを知的分子設計へ橋渡しする能力を示しています。