Claudeは悪化している、Claudeによれば

The Register / 2026/4/14

💬 オピニオンSignals & Early TrendsIndustry & Market Moves

要点

  • この記事では、Claudeに対して寄せられる品質面の苦情が増えており、最終的に短時間の障害に至ったと報告している。
  • 問題は、単発の孤立した失敗ではなく、Claudeのパフォーマンスや出力が知覚的に低下していることとして位置付けられている。
  • この記事は、信頼性や応答の品質についてユーザーの疑念が公の議論を生むほどに強まっていることを示唆している。
  • さらに、今回のインシデントが継続中の懸念と同時期に発生したことを強調しており、一度きりの出来事ではなく傾向であることを示している。

Claudeは悪くなっている、とClaudeが言っている

Mon 13 Apr 2026 // 20:35 UTC

かつてはあらゆるプログラマーのAI界隈で寵愛されていたAnthropicのClaudeだが、コスト面でも、そして認識される品質面でも、かなりの勢いでつまずいている。月曜日には「大規模な障害」によりサービスが短時間ダウンしており、これは、ボットですら見て取れるほど高まっている顧客の不満をさらに増幅させているだけだ。

障害はエラー率の上昇を伴い、15:31から16:19(UTC)の間にClaude.aiとClaude Codeに影響した。

4月13日の障害のスクリーンショット

4月13日の障害のスクリーンショット - クリックして拡大

それだけではない。ここ数か月、Claudeの回答は満足度が下がってきている、とソーシャル メディア 投稿や、GitHubで提出された課題(イシュー)が示している。これは、Anthropicが容量と需要のバランスをとるために、ピーク時の利用を抑えるための手順を講じる必要があったことに起因している。

より客観的な測定を行うため、私たちはClaude自身を使ってClaude CodeのGitHubリポジトリを指示し、品質に関する言及があるオープンイシューに絞り込み、次のプロンプトを与えた。「2026年1月以降、このリポジトリにおけるClaude Code品質に関する苦情を分析し、グラフ化せよ。品質への懸念に言及しているオープンイシューを使用せよ。これらの懸念は最近増えているか?」

AnthropicのAIモデルは結論づけた。「はい、品質に関する苦情は急激にエスカレートしている――データはかなり明確な物語を示している。」

Claude Codeの品質問題に関するClaudeによる評価

Claude Codeの品質問題に関するClaudeによる評価 - クリックして拡大

返却形式: {"translated": "翻訳されたHTML"}

私たちは月曜日にClaudeに自己分析をやり直すよう依頼しましたが、結果は似たもので、モデルは「速度が注目に値します。4月はすでに13日で20件以上の品質問題に達しており、3月の18件を超えるペースです――3月の18件自体、1月〜2月のベースラインから3.5倍の跳ね上がりでした。」と出力しました。 

しかし、Claude自体は信頼できる語り手ではありません。また、誰か(あるいは何らかのボット)がClaude Codeのリポジトリに懸念を報告したからといって、その報告が正確で妥当であることを意味するわけではありません。現在、多くの問題がAIによって生成されているように見えます――これはオープンソース開発者の間で広く報告されている懸念であり、報告件数の増加に寄与している可能性があります。

AnthropicのGitHub Actionsスクリプトもまた、一定期間の非アクティブの後に問題を自動的にクローズするように見えます。これが、未解決の問題を見えにくくする役割を果たしているかもしれません。

The Registerは、Claudeが分析で挙げたいくつかの問題を取り上げています。例えば「キャッシュの問題」や、AMDのAIディレクターであるステラ・ローレンツォ(Stella Laurenzo)が、Claudeの応答が悪くなってきていると述べた「主張」などです。その他のものについては、まだ裏付けが取れていません。例えば「1つの主張」として、「Claudeが自律的に、実在する有料顧客(JIXEN)に属する35,254件のプロダクション顧客メッセージ記録と、35,874件の請求取引を削除した」というものがあります。

この投稿の背後にいる個人、またはボットアカウントは、それ以外の投稿を行っていません。The Registerは、インドで登録されたと思われる非公開企業Jixen Enterprises Private Limitedに連絡を取り、その主張の確認を試みましたが、返答は得られていません。開発者は、Claude Codeや他のモデルの利用によるデータ損失を報告しています。しかし、仮にそれが起きたとしても、ユーザー側のミスが否定されていない可能性があります。

いずれにせよ、Claudeは自らの「推論」を正当化するために、実際のGitHubの問題投稿を引用することができるため、品質に関する報告が増えているという一般的な傾向は明らかです。

モデルは、結論を裏付ける根拠として、「資本がリスクにさらされるプロジェクトにおけるClaude Codeの予測優先の挙動は危険だ」#46212、「(Febの)アップデートでは複雑なエンジニアリング課題に対してClaude Codeは使い物にならない」#42796Claude Codeの責任者ボリス・チェルニー(Boris Cherny)が対応した)、「人工的な劣化、取得バイアス、そして有料ユーザー向けの受け入れがたい計算抑制」#46949、そして「Opus 4.6:反復的なコーディング課題での深刻な品質劣化」#46099といった問題を挙げています。

しかし、Margin Labのデータは、Claude Opus 4.6が少なくともSWE-Bench-Proテストでスコアを維持していることを示唆しています。2月以降に実施された評価では、多少の変動はあるものの、大きな変化は見られないとされています。

Anthropicは、Claudeの品質に関する懸念についてコメントするよう求めた依頼に、すぐには返答しませんでした。®

これらに近い内容
×

より絞り込まれたトピック

関連情報

これらに似た内容
×

より絞り込んだトピック