かつてはあらゆるプログラマーのAI界隈で寵愛されていたAnthropicのClaudeだが、コスト面でも、そして認識される品質面でも、かなりの勢いでつまずいている。月曜日には「大規模な障害」によりサービスが短時間ダウンしており、これは、ボットですら見て取れるほど高まっている顧客の不満をさらに増幅させているだけだ。
障害はエラー率の上昇を伴い、15:31から16:19(UTC)の間にClaude.aiとClaude Codeに影響した。
それだけではない。ここ数か月、Claudeの回答は満足度が下がってきている、とソーシャル メディア 投稿や、GitHubで提出された課題(イシュー)が示している。これは、Anthropicが容量と需要のバランスをとるために、ピーク時の利用を抑えるための手順を講じる必要があったことに起因している。
より客観的な測定を行うため、私たちはClaude自身を使ってClaude CodeのGitHubリポジトリを指示し、品質に関する言及があるオープンイシューに絞り込み、次のプロンプトを与えた。「2026年1月以降、このリポジトリにおけるClaude Code品質に関する苦情を分析し、グラフ化せよ。品質への懸念に言及しているオープンイシューを使用せよ。これらの懸念は最近増えているか?」
AnthropicのAIモデルは結論づけた。「はい、品質に関する苦情は急激にエスカレートしている――データはかなり明確な物語を示している。」
返却形式: {"translated": "翻訳されたHTML"}私たちは月曜日にClaudeに自己分析をやり直すよう依頼しましたが、結果は似たもので、モデルは「速度が注目に値します。4月はすでに13日で20件以上の品質問題に達しており、3月の18件を超えるペースです――3月の18件自体、1月〜2月のベースラインから3.5倍の跳ね上がりでした。」と出力しました。
しかし、Claude自体は信頼できる語り手ではありません。また、誰か(あるいは何らかのボット)がClaude Codeのリポジトリに懸念を報告したからといって、その報告が正確で妥当であることを意味するわけではありません。現在、多くの問題がAIによって生成されているように見えます――これはオープンソース開発者の間で広く報告されている懸念であり、報告件数の増加に寄与している可能性があります。
AnthropicのGitHub Actionsスクリプトもまた、一定期間の非アクティブの後に問題を自動的にクローズするように見えます。これが、未解決の問題を見えにくくする役割を果たしているかもしれません。
The Registerは、Claudeが分析で挙げたいくつかの問題を取り上げています。例えば「キャッシュの問題」や、AMDのAIディレクターであるステラ・ローレンツォ(Stella Laurenzo)が、Claudeの応答が悪くなってきていると述べた「主張」などです。その他のものについては、まだ裏付けが取れていません。例えば「1つの主張」として、「Claudeが自律的に、実在する有料顧客(JIXEN)に属する35,254件のプロダクション顧客メッセージ記録と、35,874件の請求取引を削除した」というものがあります。
この投稿の背後にいる個人、またはボットアカウントは、それ以外の投稿を行っていません。The Registerは、インドで登録されたと思われる非公開企業Jixen Enterprises Private Limitedに連絡を取り、その主張の確認を試みましたが、返答は得られていません。開発者は、Claude Codeや他のモデルの利用によるデータ損失を報告しています。しかし、仮にそれが起きたとしても、ユーザー側のミスが否定されていない可能性があります。
いずれにせよ、Claudeは自らの「推論」を正当化するために、実際のGitHubの問題投稿を引用することができるため、品質に関する報告が増えているという一般的な傾向は明らかです。
モデルは、結論を裏付ける根拠として、「資本がリスクにさらされるプロジェクトにおけるClaude Codeの予測優先の挙動は危険だ」#46212、「(Febの)アップデートでは複雑なエンジニアリング課題に対してClaude Codeは使い物にならない」#42796(Claude Codeの責任者ボリス・チェルニー(Boris Cherny)が対応した)、「人工的な劣化、取得バイアス、そして有料ユーザー向けの受け入れがたい計算抑制」#46949、そして「Opus 4.6:反復的なコーディング課題での深刻な品質劣化」#46099といった問題を挙げています。
しかし、Margin Labのデータは、Claude Opus 4.6が少なくともSWE-Bench-Proテストでスコアを維持していることを示唆しています。2月以降に実施された評価では、多少の変動はあるものの、大きな変化は見られないとされています。
Anthropicは、Claudeの品質に関する懸念についてコメントするよう求めた依頼に、すぐには返答しませんでした。®
より絞り込まれたトピック
- アクセシビリティ
- AdBlock Plus
- AIOps
- アプリ
- アプリケーション デリバリー コントローラー
- Audacity
- クロード
- Confluence
- データベース
- DeepSeek
- DevOps
- FOSDEM
- FOSS
- Gemini
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換フォーマット
- IDE
- 画像圧縮
- Jenkins
- レガシー技術
- LibreOffice
- 機械学習
- 地図
- MCubed
- Microsoft 365
- Microsoft Office
- Microsoft Teams
- モバイル デバイス管理
- ニューラルネットワーク
- NLP
- OpenOffice
- プログラミング言語
- QRコード
- リトリーバル拡張生成
- レトロ・コンピューティング
- 検索エンジン
- ソフトウェア マテリアルの請求書
- ソフトウェアのバグ
- ソフトウェア ライセンス
- スター・ウォーズ
- テンソル処理ユニット
- テキスト エディター
- TOPS
- ユーザー インターフェース
- Visual Studio
- Visual Studio Code
- WebAssembly
- Web ブラウザー
- WordPress
関連情報
より絞り込んだトピック
- アクセシビリティ
- AdBlock Plus
- AIOps
- アプリ
- アプリケーション デリバリー コントローラー
- Audacity
- Claude
- Confluence
- データベース
- DeepSeek
- Devops
- FOSDEM
- FOSS
- Gemini
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換フォーマット
- IDE
- 画像圧縮
- Jenkins
- レガシーテクノロジー
- LibreOffice
- 機械学習
- 地図
- MCubed
- Microsoft 365
- Microsoft Office
- Microsoft Teams
- モバイルデバイス管理
- ニューラルネットワーク
- NLP
- OpenOffice
- プログラミング言語
- QRコード
- リトリーバル拡張生成
- レトロコンピューティング
- 検索エンジン
- ソフトウェア部品表
- ソフトウェアのバグ
- ソフトウェアライセンス
- スター・ウォーズ
- テンソル処理装置
- テキストエディター
- TOPS
- ユーザーインターフェース
- Visual Studio
- Visual Studio Code
- WebAssembly
- Webブラウザ
- WordPress






