私がOpus 4.7を「アホになった」とあまり感じなかった理由
Zenn / 2026/5/6
💬 オピニオンSignals & Early TrendsModels & Research
要点
- 著者は「Opus 4.7がアホになった」との評価に対し、自身の体感では大きな劣化をあまり感じなかったと述べている
- その理由は、以前の期待や評価軸と今回の挙動が必ずしも一致しない可能性、要求(プロンプト)の切り方の影響を考慮している点にある
- 要求駆動(requirements-driven)的な使い方をすることで、モデルの出力品質の評価が変わり得るという観点が示されている
- 単純な賛否ではなく、どの条件下で「賢さ/劣化」を見ているかを揃えることの重要性が示唆される
いまさらではありますが、Claude Opus 4.7 が出てから、X や Reddit では「Claude がバカになった」「Opus 4.6 のほうがよかった」という反応をよく見かけます。
ただ、私の使い方では、正直あまりその体感がありませんでした。
もちろん、私の感度が低いだけという可能性はあります。普段から全モデルを横並びで厳密に比較しているわけではないので、細かい変化を全部拾えている自信はありません。
それでも、少なくとも日常的に AI エージェントへ実装を任せている中で、「急にアホになったな」と強く感じる場面はあまりありませんでした。
最初は単に運がよかったのか、私が鈍かった...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



