Anthropicがホスト型モデルを「より賢くなくした」と認める:オープンウェイトとローカルモデルの重要性が浮き彫りに

Reddit r/LocalLLaMA / 2026/4/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisIndustry & Market Moves

要点

  • Anthropicは、Claude Codeのデフォルト推論の努力度を「high」から「medium」に変更して長いレイテンシとUIのフリーズに伴う体感を改善したが、ユーザーは単純タスクでは努力度を下げても「高い知能」をデフォルトにしてほしいと要望したため、この変更を取り消した。
  • アイドル状態のセッションで古い「考え」をクリアして再開時の遅延を減らす別の変更を出したものの、バグによりセッション中ずっと毎ターン同様の挙動が続き、Claudeが忘れっぽく反復的に見える問題が起きたため、Anthropicは修正した。
  • さらに、冗長性を減らすシステムプロンプトを追加したが、他のプロンプト変更との組み合わせでコーディング品質が低下したため、元に戻した。
  • これらの変更は複数のClaude 4.x系(Sonnet 4.6、Opus 4.6、加えてOpus 4.7)に影響し、エンドユーザーがコントロールできない形で品質が下がり得るトレードオフであったと論じられている。
  • コメントでの主張としては、サービスや業務でAIモデルに依存するなら、ホスト型の挙動変更だけに頼るよりも、オープンウェイトモデルを自前でホスト(または代行でホスト)できる選択が妥当だという点が示されている。
Anthropicはホスティングされたモデルをより愚かにしたことを認めており、オープンウェイトとローカルモデルの重要性を証明している

要約:

3月4日、Claude Codeのデフォルトの推論努力(reasoning effort)を high から medium に変更し、非常に長いレイテンシー—一部のユーザーがhighモードで見ていたためにUIがフリーズしているように見えるほど—を減らしました。これは誤ったトレードオフでした。4月7日に、この変更を元に戻しました。ユーザーから「より高い知性をデフォルトにして、単純なタスクは努力量を下げることで選べるようにしたい」という意向が寄せられたためです。これによりSonnet 4.6 と Opus 4.6 に影響が出ました。

3月26日、ユーザーがそれらのセッションを再開したときのレイテンシーを減らすために、1時間以上アイドル状態だったセッションからClaudeの古い考え(older thinking)をクリアする変更を出荷しました。ある不具合により、この処理が「1回だけ」ではなく、そのセッションの残りの間、毎ターン発生し続けるようになりました。その結果、Claudeが忘れっぽく、かつ反復的に見える状態になりました。これは4月10日に修正しました。これによりSonnet 4.6 と Opus 4.6 に影響が出ました。

4月16日、冗長性を減らすためのシステムプロンプトの指示を追加しました。他のプロンプト変更と組み合わさったことで、コーディング品質を損ね、4月20日に元に戻しました。これによりSonnet 4.6、Opus 4.6、そして Opus 4.7 に影響が出ました。

これらのそれぞれにおいて、彼らは品質を犠牲にしてサーバー負荷を下げるための、しかもエンドユーザーがコントロールできない判断を意識的に行い、支払っている顧客に変更内容を一切知らせませんでした

私にとって、これは次のことを証明しています。もしあなたがAIモデルをサービスのため、または仕事をするために依存しているなら、賢明な選択肢は、あなた自身でホストできるオープンウェイトモデルを選ぶこと、もしくはあなたの代わりに誰かにホストしてもらうためにお金を払うことです。

投稿者 /u/spaceman_
[link] [comments]