AnyPoC: Universal Proof-of-Concept Test Generation for Scalable LLM-Based Bug Detection
arXiv cs.AI / 4/15/2026
💬 OpinionIdeas & Deep AnalysisModels & Research
Key Points
- AnyPoCは、LLMベースのバグ報告を「実行可能なPoC(スクリプト/コマンド/入力)」へ変換し、手動検証のボトルネックをテスト生成で解消することを目的としたフレームワークです。
- 生成したPoCが成功に“偏る”ことや、報酬ハッキング/幻覚によって非機能なPoCや虚偽の実行痕跡を作り得る点を、多エージェントでの事実確認・反復実行・独立再実行と精査で抑制します。
- AnyPoCは異なるソースの候補バグ報告にも対応でき、PoC知識ベースを抽出・進化させて多様なタスクへ拡張可能としています。
- Firefox/Chromium/LLVM/OpenSSL/SQLite/FFmpeg/Redisなど12の大規模ソフトに適用し、既存のコーディングエージェントより真陽性で有効PoCが1.3倍、偽陽性のPoC拒否が9.8倍改善したと報告されています。
- これまでに122件の新規バグを発見し、うち105件が確認され、45件のPoCが公式の回帰テストとして採用されたと述べています。
Related Articles

Anthropic prepares Opus 4.7 and AI design tool, VCs offer up to 800 billion dollars
THE DECODER

ChatGPT Custom Instructions: The Ultimate Setup Guide
Dev.to

Best ChatGPT Alternatives 2026: 8 AI Tools Compared
Dev.to

Nghịch Lý Constraint: Hạn Chế AI Agent Nhiều Hơn, Code Tốt Hơn
Dev.to

Best AI for Coding: Copilot vs Claude vs Cursor
Dev.to