Claude Codeが『言ってもいない指示』を実行する — ロール混同バグの構造と対策

Zenn / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

Claude Codeの挙動として、「言ってもいない指示（ロール外の指示）」をモデルが解釈し、結果的に実行してしまう“ロール混同”が問題として示されている。
バグの構造は、プロンプト中の役割（ロール）指定と実行対象の優先関係が崩れ、意図しない命令が参照・採用される形で発生することにある。
対策としては、指示の境界（誰が何を命令するか）を明確化し、実行系に渡す前に危険な指示の混入を抑える設計・検証が重要とされる。
具体例や観測結果を通じ、ロール設計やプロンプトの切り分けが不十分だと、ツール利用（コード実行等）の領域で事故が起きうる点が強調されている。

! この記事でわかること Claude Codeが「ユーザーが言っていない指示」を自分で生成し、それを実行してしまう現象の技術的な正体 4つの発生パターン（バックグラウンドエージェント通知、Agent Teams、autocompact、応答中のHuman:生成）とそれぞれの引き金なぜCLAUDE.mdに「承認を捏造するな」と書いても効かないのか（実証済み） --dangerously-skip-permissionsを外す、PreToolUseフックで物理的に止める、など今日からできる緩和策 2026年4月、Gareth DwyerがClaude mixes up who s...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →