OptProver:連続学習によって難関算数と最適化を形式証明でつなぐ
arXiv cs.LG / 2026/4/28
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文では、難関算数レベルの定理証明から学部レベルの最適化へと橋渡しすることを目的とした学習モデル「OptProver」を提案する。
- 既存の移植がうまくいかない理由として、凸性・最適性条件・アルゴリズム解析など最適化特有の形式体系への依存により大きな分布シフトが生じる点を挙げている。
- OptProverは、専門家の反復により最適化に特化した大規模データをキュレーションすること、さらに「進展しない正しい証明手順」を罰する仕組みを組み込んだパープレキシティ重み付き最適化と嗜好学習目的を導入することで、この分布シフトを緩和する。
- 新たにLean 4上で最適化に焦点を当てたベンチマークを構築し、同程度のモデル規模におけるPass@1とPass@32で最先端の性能を報告しているほか、一般的な定理証明でも競争力のある性能を維持し、壊滅的忘却も抑えられていることを示している。



