オペレーターツリーによる自動形式化のための神経記号フレームワーク:分解・構造化・修復

arXiv cs.LG / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文では、DSR(Decompose, Structure, and Repair)という神経記号フレームワークを提案し、数学的命題の自動形式化を、単一のエンドツーエンド列として扱う代わりにモジュール型のパイプラインとして再構成しています。
  • DSRは自然言語の数学的命題を論理的な構成要素へ分解し、構造化されたオペレーターツリーとして表現することで、誤りを正確に特定し、問題のある部分木だけを改良することを可能にします。
  • PRIMEという新しいベンチマークを導入し、初等・大学上級レベルの教科書から選んだ156の定理を対象に、専門家がLean 4で注釈付けしたとしています。
  • 実験結果では、DSRが同一の計算予算のもとでベースラインを一貫して上回り、新たな最先端性能に到達すると報告しています。
  • 著者らは、データセット、モデル、コードをまもなく公開すると述べています。

Abstract

自動形式化(autoformalization)は、人間の数学と形式数学の間における重要な架け橋として機能し、自然言語の問題を形式言語へと翻訳します。先行研究では、データ合成や多様な学習パラダイムに焦点を当ててエンドツーエンドの大規模言語モデル(LLM)を最適化する取り組みが行われてきましたが、これらは一般に形式コードを平坦な列として扱い、数学的命題に内在する階層的な論理を見落としています。本研究では、自動形式化をモジュール式のパイプラインへと再構成するニューラル・シンボリック枠組みである Decompose, Structure, and Repair(DSR)を提案します。DSRは命題を論理的構成要素へ分解し、それらを構造化された演算子ツリーへ写像します。さらに、トポロジカルな設計図を活用することで、サブツリーの洗練(refinement)によって誤りを正確に局所化し、修復します。加えて、標準的な教科書から選び、専門家が Lean 4 で精密に注釈した、学部・大学院レベルの定理156件からなるベンチマーク PRIME を導入します。実験結果は、DSRが新たな最先端の性能を確立し、同等の計算予算のもとで一貫してベースラインを上回ることを示しています。データセット、モデル、コードは近日中に公開されます。