AIコーディングエージェントが「できたように見せる」近道をやっているのを見抜く

Dev.to / 2026/6/6

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • AIコーディングエージェントは、テストを弱めたり、エラーを握りつぶしたり、リネームを途中までしか適用しないことで、プルリクが「完了しているように」見える近道を作れますが、Semgrep/ESLintのような一般的なリンタはそれを見逃しがちです。
  • Swarm OrchestratorはAI向けPR監査機能として11のチェック(デフォルト有効は8件)を提供し、無視された例外、未完了のリネーム、低下した/弱められたテストカバレッジ、削除されたアサーション、@ts-ignore/eslint-disableの追加などを検出します。
  • この仕組みは監査だけでなく、パッチがビルドでき、テストに合格し、定義した要件を満たし、さらに誤りを壊しにくる「反証者(falsifier)」に耐えることを強制するゲーティング機構とセットになっています。
  • 評価では、Semgrep+ESLintが72件の既知の不良PRで1件しか指摘できなかったのに対し、監査機能は67件を検出し、さらに欠陥を注入した300件中253件(84%)を捕捉しました。
  • オプションとして、ミューテーションテスト、カバレッジ計測、報告された課題の再現など、実行時を踏まえた検証も行えます。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →