分子特性のインコンテキスト予測のための表形式ファウンデーションモデル
arXiv cs.LG / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、タスク固有の微調整を不要にし、MLの専門知識の負担も減らしつつ、インコンテキスト学習によって分子特性を予測する表形式ファウンデーションモデル(TFM)を提案している。
- 医薬品ベンチマークと化学工学データの両方で、少〜中規模データ領域の実験を行い、微調整よりも計算コストを抑えながら高い予測精度が得られることを示している。
- TFMsの評価では、凍結した分子ファウンデーションモデル埋め込みに加えて、従来の記述子やフィンガープリントも用いられ、表現(レプレゼンテーション)の選択が性能に強く影響することが分かった。
- TFMsとCheMeleon埋め込みを組み合わせると、MoleculeACEの30タスクで最大100%の勝率を達成し、RDKit2dやMordredのようなコンパクトな記述子セットでも良好な代替が示された。
- 総じて、適切な分子表現と組み合わせたTFMによるインコンテキスト学習は、創薬やプロセス設計などの実運用で高精度かつ低コストな特性予測手法になり得ることを示唆している。