反証を学ぶ：大規模言語モデルによる形式的反例生成

arXiv cs.AI / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

著者らは、大規模言語モデルを微調整して形式的反例を推論・生成する方法を提案し、Lean 4で形式的に証明された証明の作成も含む。
定理を抽出し、仮説を選択的に捨てることで多様な訓練データを作り出し、さまざまな反例のインスタンスを生み出すシンボリック変異戦略を導入した。
このアプローチは、反例生成と定理証明のための大規模言語モデルの訓練を効果的かつ効率的にするため、複数報酬を持つエキスパート反復フレームワークに組み込まれている。
3つのベンチマークにおける実験結果は、変異戦略および全体的な訓練フレームワークから顕著な性能向上を示している。

概要:
数学的推論には、真の命題に対して厳密な証明を構築する能力と、偽りの命題を反証する反例を見つけ出す能力という、二つの重要で相補的なスキルが求められます。
しかし、現在の数学分野のAI研究はほぼ唯一、証明の構築に焦点を当てており、反例を見つけるという同等に重要な課題をしばしば見過ごしています。
本論文では、反例を推論し生成するために大規模言語モデル（LLM）を微調整することで、このギャップに対処します。
これには、LLMが候補となる反例を提案するだけでなく、Lean 4定理証明機で自動検証可能な形式的証明を作成することが求められます。
効果的な学習を実現するために、定理を体系的に抽出し、選択された仮説を破棄することで多様な訓練データを合成する象徴的変異戦略を導入し、さまざまな反例のインスタンスを生み出します。
厳選されたデータセットとともに、この戦略は、反例生成と定理証明のためのLLMの訓練の有効性と効率を大幅に高める、複数報酬のエキスパート反復フレームワークを可能にします。
新たに収集された3つのベンチマークにおける実験は、我々のアプローチの利点を検証し、変異戦略と訓練フレームワークが顕著な性能向上をもたらすことを示しています。

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

成長を生み出すCRM開発

Dev.to

カーパシーのオートリサーチ：エージェント型コーディングスキルの向上

Dev.to

API vs Local LLM、まだ感覚で選んでないか？

Qiita

実際に機能するAIプロンプトの書き方

Dev.to

反証を学ぶ：大規模言語モデルによる形式的反例生成

要点

関連記事

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

成長を生み出すCRM開発

カーパシーのオートリサーチ：エージェント型コーディングスキルの向上

API vs Local LLM、まだ感覚で選んでないか？

実際に機能するAIプロンプトの書き方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer