要旨: USPTOのような化学反応データセットは、実質的な不完全さに悩まされており、しばしば副生成物、共反応物、化学量論係数が欠落しています。これにより、下流の応用における適用可能性と信頼性が制限されます。ここでは、現実的な欠測データ条件下での反応完結(reaction completion)を対象とした、大規模な教師ありベンチマークであるCompleteRXNを提案します。USPTOの記録を厳選された機構反応に対応付けることで、不完全な反応と原子バランスのとれた反応を整合させたデータセットを構築します。新規のエンコーダ・デコーダ型反応完結モデル(制約付きデコーディング)を含む代表的ベースライン、Constrained Reaction Balancer(CRB)、および最近のアルゴリズム手法であるSynRBLを評価します。CompleteRXNベンチマークにおいて、CRBは難易度が増す各分割にわたり高い性能を達成し、ランダム分割では同値(equivalence)精度99.20%を、極端な分布外(out-of-distribution)分割では91.12%を記録しました。SynRBLは、多くのバランスが取れ、化学的にも妥当な完結(completion)を生成しますが、ベンチマークのテスト分割では精度がより低くなります。全手法に共通して、不完全さが増すにつれて性能が低下します。さらに、ベンチマークの外側の反応(完全で未キュレーションのUSPTO)で評価すると、顕著な性能低下が見られます。これは、ベンチマークでの性能と実際の頑健性(practical robustness)の間に大きな隔たりがあることを示しており、今後の研究の動機付けとなります。
CompleteRXN:化学反応データベースを「完成」させるために
arXiv cs.LG / 2026/5/4
📰 ニュースModels & Research
要点
- 既存の化学反応データセット(USPTOなど)は、反応の副生成物・共反応物・化学量論係数などが欠落しがちで、大きな不完全性があるため、下流用途での信頼性が損なわれる。
- 本稿では、欠落データを現実的に想定した「反応完結」を扱う大規模教師ありベンチマーク CompleteRXN を提案し、USPTOの記録をキュレーション済みの機構反応に対応付けることで、原子数バランスが取れた整合データを構築している。
- ベースラインとして、制約付きデコーダを用いるエンコーダーデコーダ型の反応完結モデル、Constrained Reaction Balancer(CRB)、SynRBL などを比較し、不完全性が増えるほど性能が低下することを示した。
- CRB が最も高いベンチマーク性能を示し、ランダム分割で等価性精度 99.20%、極端なOOD分割で 91.12% を達成した。
- ベンチマーク外(未キュレーションのUSPTO全体)で評価すると精度が大きく低下するため、ベンチマーク指標と実運用での頑健性の間にギャップがあり、今後の改善が必要であることが強調されている。



