オペレーターツリーによる自動形式化のための神経記号フレームワーク：分解・構造化・修復

arXiv cs.LG / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文では、DSR（Decompose, Structure, and Repair）という神経記号フレームワークを提案し、数学的命題の自動形式化を、単一のエンドツーエンド列として扱う代わりにモジュール型のパイプラインとして再構成しています。
DSRは自然言語の数学的命題を論理的な構成要素へ分解し、構造化されたオペレーターツリーとして表現することで、誤りを正確に特定し、問題のある部分木だけを改良することを可能にします。
PRIMEという新しいベンチマークを導入し、初等・大学上級レベルの教科書から選んだ156の定理を対象に、専門家がLean 4で注釈付けしたとしています。
実験結果では、DSRが同一の計算予算のもとでベースラインを一貫して上回り、新たな最先端性能に到達すると報告しています。
著者らは、データセット、モデル、コードをまもなく公開すると述べています。

Abstract

自動形式化（autoformalization）は、人間の数学と形式数学の間における重要な架け橋として機能し、自然言語の問題を形式言語へと翻訳します。先行研究では、データ合成や多様な学習パラダイムに焦点を当ててエンドツーエンドの大規模言語モデル（LLM）を最適化する取り組みが行われてきましたが、これらは一般に形式コードを平坦な列として扱い、数学的命題に内在する階層的な論理を見落としています。本研究では、自動形式化をモジュール式のパイプラインへと再構成するニューラル・シンボリック枠組みである Decompose, Structure, and Repair（DSR）を提案します。DSRは命題を論理的構成要素へ分解し、それらを構造化された演算子ツリーへ写像します。さらに、トポロジカルな設計図を活用することで、サブツリーの洗練（refinement）によって誤りを正確に局所化し、修復します。加えて、標準的な教科書から選び、専門家が Lean 4 で精密に注釈した、学部・大学院レベルの定理156件からなるベンチマーク PRIME を導入します。実験結果は、DSRが新たな最先端の性能を確立し、同等の計算予算のもとで一貫してベースラインを上回ることを示しています。データセット、モデル、コードは近日中に公開されます。

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に

日経XTECH

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

AI-SCHOLAR

初心者からの「Claude AI」の学び方：ステップバイステップ入門ガイド

Dev.to

サステナビリティアプリのために自作のイベントバスを作った—OpenClawを使ったエージェント自動化で学んだこと

Dev.to

LLMは失敗しない——実行が失敗する：エージェント型AIに必要な制御レイヤー

Dev.to

オペレーターツリーによる自動形式化のための神経記号フレームワーク：分解・構造化・修復

要点

Abstract

関連記事

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

初心者からの「Claude AI」の学び方：ステップバイステップ入門ガイド

サステナビリティアプリのために自作のイベントバスを作った—OpenClawを使ったエージェント自動化で学んだこと

LLMは失敗しない——実行が失敗する：エージェント型AIに必要な制御レイヤー

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

35歳主任エンジニア、管理職か専門職かの選択に悩む キャリアの岐路に

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

初心者からの「Claude AI」の学び方：ステップバイステップ入門ガイド

サステナビリティアプリのために自作のイベントバスを作った—OpenClawを使ったエージェント自動化で学んだこと

LLMは失敗しない——実行が失敗する：エージェント型AIに必要な制御レイヤー

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に