探索を計画する:LLMテスト生成のための好奇心駆動型プランニング
arXiv cs.CL / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMベースのコードテスト生成が、即時のカバレッジ獲得を優先する貪欲戦略によって頭打ちになる問題を扱う。そこでは、準備となるセットアップ手順を要する深い分岐を計画できず、十分に到達できない。
- 提案手法は、好奇心駆動型のプランニングアプローチ CovQValue である。これはプログラムの分岐構造を未知の環境としてモデル化し、ベイズ的な探索の考え方に基づく事後分布の代理として、更新され続けるカバレッジマップを用いる。
- CovQValue はカバレッジマップを LLM に組み込むことで、複数の候補となる行動計画を並列に生成し、LLM が推定した Q 値に基づいて計画を選択する。これにより、短期的な発見と長期的な到達可能性のバランスを取る。
- TestGenEval Lite による実験では、3つの代表的な LLM に対して、貪欲な選択に比べて分岐カバレッジが 51〜77% 向上し、ターゲットの 77〜84% で成功が得られた。反復生成の評価には、新たなベンチマーク RepoExploreBench を用いた。
- これらの結果は、LLM によるテスト生成において、カバレッジのみを手がかりにしたヒューリスティックよりも、逐次的な好奇心駆動型の探索の方がプログラム挙動の発見に効果的であることを示唆している。