CompleteRXN：化学反応データベースを「完成」させるために

arXiv cs.LG / 2026/5/4

📰 ニュースModels & Research

共有:

要点

既存の化学反応データセット（USPTOなど）は、反応の副生成物・共反応物・化学量論係数などが欠落しがちで、大きな不完全性があるため、下流用途での信頼性が損なわれる。
本稿では、欠落データを現実的に想定した「反応完結」を扱う大規模教師ありベンチマーク CompleteRXN を提案し、USPTOの記録をキュレーション済みの機構反応に対応付けることで、原子数バランスが取れた整合データを構築している。
ベースラインとして、制約付きデコーダを用いるエンコーダーデコーダ型の反応完結モデル、Constrained Reaction Balancer（CRB）、SynRBL などを比較し、不完全性が増えるほど性能が低下することを示した。
CRB が最も高いベンチマーク性能を示し、ランダム分割で等価性精度 99.20%、極端なOOD分割で 91.12% を達成した。
ベンチマーク外（未キュレーションのUSPTO全体）で評価すると精度が大きく低下するため、ベンチマーク指標と実運用での頑健性の間にギャップがあり、今後の改善が必要であることが強調されている。

要旨: USPTOのような化学反応データセットは、実質的な不完全さに悩まされており、しばしば副生成物、共反応物、化学量論係数が欠落しています。これにより、下流の応用における適用可能性と信頼性が制限されます。ここでは、現実的な欠測データ条件下での反応完結（reaction completion）を対象とした、大規模な教師ありベンチマークであるCompleteRXNを提案します。USPTOの記録を厳選された機構反応に対応付けることで、不完全な反応と原子バランスのとれた反応を整合させたデータセットを構築します。新規のエンコーダ・デコーダ型反応完結モデル（制約付きデコーディング）を含む代表的ベースライン、Constrained Reaction Balancer（CRB）、および最近のアルゴリズム手法であるSynRBLを評価します。CompleteRXNベンチマークにおいて、CRBは難易度が増す各分割にわたり高い性能を達成し、ランダム分割では同値（equivalence）精度99.20%を、極端な分布外（out-of-distribution）分割では91.12%を記録しました。SynRBLは、多くのバランスが取れ、化学的にも妥当な完結（completion）を生成しますが、ベンチマークのテスト分割では精度がより低くなります。全手法に共通して、不完全さが増すにつれて性能が低下します。さらに、ベンチマークの外側の反応（完全で未キュレーションのUSPTO）で評価すると、顕著な性能低下が見られます。これは、ベンチマークでの性能と実際の頑健性（practical robustness）の間に大きな隔たりがあることを示しており、今後の研究の動機付けとなります。

Blackstone、Hellman & Friedman、Goldman Sachsとともに新たなエンタープライズAIサービス企業を設立

Anthropic News

三菱電機も出資するユニコーン予備軍東大発新興の燈、フィジカルAI 「26年内に」

日経XTECH

ウーバーCEOダラ・コホロシ（AIで運転手を——そして自分まで—置き換える件）

The Verge

CLMAフレームテスト

Dev.to

AIエージェントのガバナンスと責任：それらの問いに答えようとして作ったもの

Dev.to

CompleteRXN：化学反応データベースを「完成」させるために

要点

関連記事

Blackstone、Hellman & Friedman、Goldman Sachsとともに新たなエンタープライズAIサービス企業を設立

三菱電機も出資するユニコーン予備軍東大発新興の燈、フィジカルAI 「26年内に」

ウーバーCEOダラ・コホロシ（AIで運転手を——そして自分まで—置き換える件）

CLMAフレームテスト

AIエージェントのガバナンスと責任：それらの問いに答えようとして作ったもの

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Blackstone、Hellman & Friedman、Goldman Sachsとともに新たなエンタープライズAIサービス企業を設立

三菱電機も出資するユニコーン予備軍 東大発新興の燈、フィジカルAI 「26年内に」

ウーバーCEOダラ・コホロシ（AIで運転手を——そして自分まで—置き換える件）

CLMAフレームテスト

AIエージェントのガバナンスと責任：それらの問いに答えようとして作ったもの

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

三菱電機も出資するユニコーン予備軍東大発新興の燈、フィジカルAI 「26年内に」