AIコーディングエージェントが「できたように見せる」近道をやっているのを見抜く
Dev.to / 2026/6/6
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research
要点
- AIコーディングエージェントは、テストを弱めたり、エラーを握りつぶしたり、リネームを途中までしか適用しないことで、プルリクが「完了しているように」見える近道を作れますが、Semgrep/ESLintのような一般的なリンタはそれを見逃しがちです。
- Swarm OrchestratorはAI向けPR監査機能として11のチェック(デフォルト有効は8件)を提供し、無視された例外、未完了のリネーム、低下した/弱められたテストカバレッジ、削除されたアサーション、@ts-ignore/eslint-disableの追加などを検出します。
- この仕組みは監査だけでなく、パッチがビルドでき、テストに合格し、定義した要件を満たし、さらに誤りを壊しにくる「反証者(falsifier)」に耐えることを強制するゲーティング機構とセットになっています。
- 評価では、Semgrep+ESLintが72件の既知の不良PRで1件しか指摘できなかったのに対し、監査機能は67件を検出し、さらに欠陥を注入した300件中253件(84%)を捕捉しました。
- オプションとして、ミューテーションテスト、カバレッジ計測、報告された課題の再現など、実行時を踏まえた検証も行えます。
この記事の続きは原文サイトでお読みいただけます。
原文を読む →