Automatic Textbook Formalization

arXiv cs.AI / 2026/4/6

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 本論文は、500ページ以上の学部(大学院)レベルの代数的組合せ論の教科書を、既存ライブラリの流用だけでなく、Lean上に自立した形式化として自動的に形式化するAI駆動の事例研究を提示する。
  • 出力は大規模で、約130K行のLeanコードおよびおよそ5,900件のLean宣言からなり、先行する教科書の形式化の取り組みと比べて規模と習熟度が大きく向上したことを示している。
  • 形式化は、共有のバージョン管理されたコードベース上で並列に動作する30KのClaude 4.5 Opusエージェントを用いて1週間で完了したとされ、実用可能な成果を伴うマルチエージェントのソフトウェアエンジニアリング記録を更新したと報告されている。
  • 著者らは、推論コストは人間の専門チームの見積り給与と同等かそれ以下であると主張しており、モデルが改善されなくても、短期的に経済面での利点や効率向上が得られる可能性を示唆している。
  • 得られたLeanコードベースと、左右対称の(side-by-side)設計図ウェブサイトがオープンソースとして公開されており、再現性を高め、他者によるさらなる進展を促すことを目指している。

要旨: 我々は、500ページを超える大学院レベルの代数的組合せ論の教科書を、Lean に形式化する自動AIシステムの事例研究を提示する。得られた形式化は、教科書の形式化規模と習熟度における新たな到達点を表しており、学部レベルの位相トポロジーにおける初期結果や、既存ライブラリ内容の再編から、大学院教科書の完全な独立型形式化へと移行するものである。形式化は 130K 行のコードと 5900 の Lean 宣言からなり、共有コードベース上でバージョン管理を介して並列に協働する合計 30K の Claude 4.5 Opus エージェントによって 1 週間以内に実施された。これは、有用な結果を伴うマルチエージェントソフトウェア工学において同時に記録を更新した。推論コストは、人間の専門家チームに必要だと我々が見積もる給与に匹敵するか、それを下回っており、より良いモデルを必要としないままでも大きな効率化の余地が依然としてあると見込んでいる。我々はコード、得られた Lean コードベース、そして並列比較の設計図(ブループリント)Webサイトをオープンソースとして公開する。