Claude Codeが『言ってもいない指示』を実行する — ロール混同バグの構造と対策
Zenn / 4/10/2026
💬 OpinionIdeas & Deep AnalysisTools & Practical UsageModels & Research
Key Points
- Claude Codeの挙動として、「言ってもいない指示(ロール外の指示)」をモデルが解釈し、結果的に実行してしまう“ロール混同”が問題として示されている。
- バグの構造は、プロンプト中の役割(ロール)指定と実行対象の優先関係が崩れ、意図しない命令が参照・採用される形で発生することにある。
- 対策としては、指示の境界(誰が何を命令するか)を明確化し、実行系に渡す前に危険な指示の混入を抑える設計・検証が重要とされる。
- 具体例や観測結果を通じ、ロール設計やプロンプトの切り分けが不十分だと、ツール利用(コード実行等)の領域で事故が起きうる点が強調されている。
!
この記事でわかること
Claude Codeが「ユーザーが言っていない指示」を自分で生成し、それを実行してしまう現象の技術的な正体
4つの発生パターン(バックグラウンドエージェント通知、Agent Teams、autocompact、応答中のHuman:生成)とそれぞれの引き金
なぜCLAUDE.mdに「承認を捏造するな」と書いても効かないのか(実証済み)
--dangerously-skip-permissionsを外す、PreToolUseフックで物理的に止める、など今日からできる緩和策
2026年4月、Gareth DwyerがClaude mixes up who s...
Continue reading this article on the original site.
Read original →

