私のノートPCで動かしたQwen3.6-35B-A3Bは、Claude Opus 4.7よりも“良い”ペリカンを描いた
2026年4月16日
誰かが(賢明ではないにもかかわらず)私の ペリカンが自転車に乗るベンチマーク を、モデルをテストする頑丈な方法として真剣に取り上げているなら、今朝の2つの大きなモデルリリースからのペリカンたちを紹介します――AlibabaのQwen3.6-35B-A3B と AnthropicのClaude Opus 4.7 です。
こちらは、この20.9GBのQwen3.6-35B-A3B-UD-Q4_K_S.gguf をUnslothが量子化したモデルを使って生成したQwen 3.6のペリカンで、LM Studio 経由でMacBook Pro M5上で動かしています(そして llm-lmstudio プラグインも)。――ここに書き起こし:

そしてこちらは、Anthropicの新しく出たClaude Opus 4.7 から私が得たものです(書き起こし):

これはQwen 3.6に譲ります。Opusは自転車のフレームを台無しにできてしまった!
thinking_level: max を渡してOpusを2回目に試しました。結果はあまり良くなりませんでした(書き起こし):

私はQwenがズルをしているとは思わない
多くの人が、このくだらないベンチマークのために、研究所が学習させていると確信している。私はそうは思いませんが、正直に言うと、この結果は少しだけ疑わしく見せてくれました。そこで私は、秘密のバックアップテストの1つを燃やします――ここにQwen3.6-35B-A3BとOpus 4.7に対して「自転車に乗っているフラミンゴのSVGを生成して」という指示で得たものがあります:
これはQwenにします。理由の一部は、素晴らしい <!-- Sunglasses on flamingo! --> のSVGコメントのおかげです。
この件から学べることは何でしょう?
ペリカンのベンチマークは、最初からずっと冗談として意図されてきました――主に、これらのモデルを比較するという仕事が、どれほど頓珍漢で無意味なものかを示すためのものです。
その冗談の気味の悪さは、概ね――生成されるペリカンの品質と、モデルの一般的な有用性との間に、直接的な相関関係があったことです。2024年10月の最初のペリカン はゴミでした。より最近のエントリ は、概ね非常に、非常に良くなっています。そこまで来ていて、Gemini 3.1 Proは、ペリカンが自転車に乗っていることをどこかで図示する切実な必要があるなら、実際に使えるようなイラスト を出すレベルにまでなりました。
しかし今日、その“ゆるい”つながりさえも壊れてしまいました。私はQwenに大きな敬意を払っていますが、最新モデルの21GB量子化版が、Anthropicの最新の独自リリースよりも強力かつ有用だと私はあまり思えません。
ただし、必要なものが「自転車に乗っているペリカン」のSVGイラストであるなら、今この時点では、ノートPCで動くQwen3.6-35B-A3BのほうがOpus 4.7より良い選択肢です!
最近の記事
これはSimon Willisonによる私のノートPCで動かしたQwen3.6-35B-A3Bは、Claude Opus 4.7よりも“良い”ペリカンを描いた(2026年4月16日 16th April 2026 投稿)です。
返却形式: {"translated": "翻訳されたHTML"} ai 1963 generative-ai 1742 local-llms 154 llms 1709 anthropic 270 claude 267 qwen 54 pelican-riding-a-bicycle 105 llm-release 191 lm-studio 19前回: Metaの新モデルはMuse Sparkで、meta.aiのチャットにはいくつかの興味深いツールがあります
月次ブリーフィング
月額10ドルでスポンサーになって、今月の最も重要なLLMの動向を厳選したメールのダイジェストを受け取ってください。
もっと少なく送るために、私にお金を払ってください!
スポンサー&購読



