不均衡・多忠実度の原子論的データ向けエクサスケール・マルチタスク・グラフ基盤モデル
arXiv cs.AI / 2026/4/20
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この論文は、HydraGNNに基づく原子論的グラフ基盤モデルを用いたエクサスケールの材料探索ワークフローを提案している。
- 16の公開された第一原理データセット(544M+構造、85元素以上)を対象に、データセットごとのヘッドを持つマルチタスク構成とADIOS2/DDStoreのスケーラブルなデータパイプラインで共同学習する。
- FrontierではFP64でDeepHyperによる大規模なハイパーパラメータ最適化キャンペーンを6件実行し、最良のメッセージパッシングモデルを2,048ノードで持続的に学習してPaiNNベースのリードモデルを得ている。
- リードモデルは、約50秒で11億(1.1B)個の原子論的構造を評価することで、ビリオン規模のスクリーニングと、少量データでの多様な下流タスク向け微調整を可能にする。
- BF16/FP32/FP64の精度と計算性能のトレードオフを定量化し、化学的に多様な12の下流タスクへの転移と、Frontier/Aurora/Perlmutterでの強スケール・弱スケールを検証している。