WybeCoder: Verified Imperative Code Generation
arXiv cs.AI / 4/1/2026
💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- 本論文は、ソフトウェア検証の改善がLLMによるコード生成や定理証明ほど進んでいない点を背景に、コード生成と不変条件・証明を同時に育てる「prove-as-you-generate」型のエージェント的検証フレームワークWybeCoderを提案しています。
- WybeCoderは、検証条件生成とSMTソルバに加え、Leanでの対話型証明を組み合わせており、コード・不変条件・証明が相互に更新される“co-evolve”を中核に据えています。
- 検証の体系的評価のため、Leanベースの2つの機能的検証ベンチマーク(VerinaとClever)を、等価な命令型(imperative)コード仕様へ翻訳することで比較可能な実験環境を整えています。
- Heapsortのような複雑アルゴリズムで、スケールさせることで有効な不変条件やサブゴールを多数生成し、従来の到達率の停滞(plateau)を超えて、目標タスクの達成率(Verina 74%、Clever 62%)を中程度の計算予算で大幅に向上させたと報告しています。
Related Articles

Black Hat Asia
AI Business

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to

Day 6: I Stopped Writing Articles and Started Hunting Bounties
Dev.to

Early Detection of Breast Cancer using SVM Classifier Technique
Dev.to

I Started Writing for Others. It Changed How I Learn.
Dev.to