MolCryst-MLIPs: A Machine-Learned Interatomic Potentials Database for Molecular Crystals

arXiv cs.LG / 4/16/2026

📰 NewsSignals & Early TrendsTools & Practical UsageModels & Research

Key Points

  • MolCryst-MLIPs は分子結晶向けのオープンな MLIP(Machine-Learned Interatomic Potentials)データベースで、初回リリースとして9つの分子結晶系(例:Benzamide、Benzoic acid など)に対するモデルとデータセットを公開しています。
  • 自動機械学習パイプライン(AMLP)を用いて、参照データ生成から学習・検証までを再現可能かつ使いやすい形で一貫して整備した開発フローが提示されています。
  • MACE-MH-1(omol head)を基盤に各系へ fine-tuning した結果、全系平均でエネルギー MAE が 0.141 kJ/mol/atom、力 MAE が 0.648 kJ/mol/Å という性能が報告されています。
  • 分子動力学シミュレーションによるエネルギー保存、P2 の配向秩序パラメータ、動径分布関数(RDF)などで動力学的安定性と構造の健全性を評価し、検証済み MLIP としての実用性を示しています。
  • 公開されたモデルとデータセットは、異なる熱力学条件下での分子結晶の多形(polymorphism)を対象とした本番級 MD シミュレーションに向けて拡張・活用可能な基盤として位置付けられています。

Abstract

We present an open Molecular Crystal (MC) database of Machine-Learned Interatomic Potentials (MLIP) called MolCryst-MLIPs. The first release comprises fine-tuned MACE models for nine molecular crystal systems -- Benzamide, Benzoic acid, Coumarin, Durene, Isonicotinamide, Niacinamide, Nicotinamide, Pyrazinamide, and Resorcinol -- developed using the Automated Machine Learning Pipeline (AMLP), which streamlines the entire MLIP development workflow, from reference data generation to model training and validation, into a reproducible and user-friendly pipeline. Models are fine-tuned from the MACE-MH-1 foundation model (omol head), yielding a mean energy MAE of 0.141 kJ/mol/atom and a mean force MAE of 0.648 kJ/mol/Angstrom across all systems. Dynamical stability and structural integrity, as assessed through energy conservation, P2 orientational order parameters, and radial distribution functions, are evaluated using molecular dynamics simulations. The released models and datasets constitute a growing open database of validated MLIPs, ready for production MD simulations of molecular crystal polymorphism under different thermodynamic conditions.