不均衡・多忠実度の原子論的データ向けエクサスケール・マルチタスク・グラフ基盤モデル

arXiv cs.AI / 2026/4/20

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

この論文は、HydraGNNに基づく原子論的グラフ基盤モデルを用いたエクサスケールの材料探索ワークフローを提案している。
16の公開された第一原理データセット（544M+構造、85元素以上）を対象に、データセットごとのヘッドを持つマルチタスク構成とADIOS2/DDStoreのスケーラブルなデータパイプラインで共同学習する。
FrontierではFP64でDeepHyperによる大規模なハイパーパラメータ最適化キャンペーンを6件実行し、最良のメッセージパッシングモデルを2,048ノードで持続的に学習してPaiNNベースのリードモデルを得ている。
リードモデルは、約50秒で11億（1.1B）個の原子論的構造を評価することで、ビリオン規模のスクリーニングと、少量データでの多様な下流タスク向け微調整を可能にする。
BF16/FP32/FP64の精度と計算性能のトレードオフを定量化し、化学的に多様な12の下流タスクへの転移と、Frontier/Aurora/Perlmutterでの強スケール・弱スケールを検証している。

Abstract

本稿では、HydraGNN上に構築された原子的グラフ基盤モデルを用いて、材料探索のためのエクサスケール・ワークフローを提案します。16の公開された第一原理データセット（544+百万の構造、85+元素をカバー）に対し、データセットごとのヘッドを備えたマルチタスク・アーキテクチャと、スケーラブルなADIOS2/DDStoreデータ・パイプラインを用いて共同で学習します。Frontier上では、FP64で6件の大規模DeepHyperハイパーパラメータ最適化キャンペーンを実行し、最高性能のメッセージパッシング・モデルを、持続的な2,048ノード学習へと昇格させ、PaiNNベースのリードモデルを得ます。その結果得られたモデルにより、10億スケールのスクリーニングが可能となり、50秒で11億の原子的構造を評価できます。これにより、第一原理計算だけで何年も要するであろう作業負荷が圧縮され、データが乏しい状況でも多様な下流タスクに対する微調整（fine-tuning）が可能になります。精度と性能のトレードオフ（BF16/FP32/FP64）を定量化し、化学的に多様な12の下流タスク間での転移を実証し、Frontier、Aurora、Perlmutterにわたるシームレスな強スケーリングおよび弱スケーリングを確立します。本研究は、第一原理手法では到達できない広大な化学設計空間を、迅速かつ信頼性高く探索することを可能にします。

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

Reddit r/MachineLearning

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

Dev.to

奥を見せる：深度認識インペインティングで「ゴーストマネキン」効果を自動化する

Dev.to

誰もがClaude Codeを間違った使い方をしている

Dev.to

低トラストのMCPサーバー呼び出し前に警告する「Claude Code」フック

Dev.to

不均衡・多忠実度の原子論的データ向けエクサスケール・マルチタスク・グラフ基盤モデル

要点

Abstract

関連記事

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

奥を見せる：深度認識インペインティングで「ゴーストマネキン」効果を自動化する

誰もがClaude Codeを間違った使い方をしている

低トラストのMCPサーバー呼び出し前に警告する「Claude Code」フック

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer