分子特性予測におけるBERT研究

arXiv cs.LG / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、データセットサイズ、モデルサイズ、ならびに標準化が、分子特性予測のための化学言語モデルの事前学習およびファインチューニングの性能にどのように影響するかを系統的に検討している。
さまざまなMPPベンチマークにおいて報告された化学言語モデル（CLMs）の結果の不一致と矛盾を、数百に及ぶ慎重に制御された実験を実施することによって扱っている。
本研究は、エンコーダーのみを用いたマスクド言語モデルに関する確立されたスケーリング則の不在を浮き彫りにし、MPPにおけるCLMの性能へ影響する根本的なメカニズムを解明するための数値的証拠を提供している。
より深い洞察と指針を提供することにより、分子特性予測のCLMsの再現性と信頼性を向上させることを目的としている。

note

note

note

note

note