AIコーディングエージェント、正しいファイルは特定するが重要な行を見落とす—研究が指摘
THE DECODER / 2026/6/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- AIコーディングエージェントは正しいソースファイルを見つけられることが多い一方で、修正に必要な「決定的な行」を特定できないことが頻繁にある。
- 研究では、コード検索をコード修復とは別に評価するSWE-Exploreベンチマークを新たに提示している。
- 検索フェーズで十分な文脈(コンテキスト)がないと、たとえ最良の自動修復でも失敗し得ることが示されている。
- 「関連コードを見つける」工程と「修正を適用する」工程を分離して評価することで、現行のエージェント・パイプラインの弱点が明確になる。
- 実運用での信頼性を高めるには、文脈処理と検索の精度を改善することが重要だという示唆が得られる。
この記事の続きは原文サイトでお読みいただけます。
原文を読む →