2026年4月24日 - リンクブログ
最近のClaude Codeの品質レポートについてのアップデート (via) 過去2か月の間、Claude Codeが提供していた品質が低いという苦情の件数が多かったのは、実際の問題に裏付けられていました。
モデルそのものが原因ではありませんでしたが、Claude Codeのハーネス(実行基盤)における3つの別々の問題が、複雑ではあるものの重大な問題を引き起こし、ユーザーに直接影響していました。
Anthropicのポストモーテムでは、これらを詳しく説明しています。特にこれが私の目を引きました:
3月26日、ユーザーがそれらのセッションを1時間以上放置していた場合に、セッションからClaudeの古い思考を消去する変更を出荷しました。これにより、ユーザーがそのセッションを再開したときのレイテンシを減らすことが目的でした。
しかしバグによって、この処理がセッションの残りの間ずっと、毎ターン発生し続けるようになってしまい、1回だけで済まず、Claudeが忘れっぽくて繰り返しているように見える原因になりました。
私はよくClaude Codeのセッションを、1時間(あるいは多くの場合1日、あるいはそれ以上)放置してから戻ってきます。今は、そのようなセッションが11個あります(ps aux | grep 'claude 'によると)。そして先日は、さらに数十個を閉じた後の数です。
私はこれらの「古くなった(stale)」セッションの方で、最近始めたセッションよりも多くの時間をプロンプト作成に費やしていると見積もっています!
エージェント型システムを作っているなら、この文章を細かく読む価値があります。たとえモデル自体の本来的な非決定性を脇に置いたとしても、ハーネスに影響するバグは非常に複雑です。
最近の記事
- LiteParse for the webでブラウザ上からPDFのテキストを抽出する - 2026年4月23日
- Codexのセミ公式バックドアAPI経由でGPT-5.5のためのペリカンを作る - 2026年4月23日
- Claude Codeは月100ドルかかるの?たぶん違う - すべてがとてもややこしい - 2026年4月22日
これはSimon Willisonによるリンク投稿で、2026年4月24日に投稿されました。
ai 1980 prompt-engineering 186 generative-ai 1756 llms 1723 anthropic 276 coding-agents 196 claude-code 108月次ブリーフィング
$10/月で私をスポンサーし、今月の最も重要なLLMの動向を厳選したメールダイジェストを受け取ってください。
私にお金を払って、あなたに送る量を減らしてもらいましょう!
スポンサー&購読する



