最近誰かがこんなことを言っているのを見かけた:「あの男は働く犬だ。仕事を与えなければ、家具を引き裂く。」Qwen3.5は働く犬だ。
最近このモデルをかなり使ってきました。カスタム量子化を三ダース作りました。三つの異なる実行バックエンドを使いました。学んだことの中で少なくとも次のことは報告できます。
これらのモデルは文脈が全くないことをひどく嫌います。彼らは情報を取りに行く猟犬です。物事に入る前に自分たちの目的を知りたがっています。あなたのシステムプロンプトは14トークンというだけですか? うまくいかないですよ。27Bは3Kトークン未満ではほとんど役に立ちません。入っていくときは5Kトークンに到達して初めて自分が何をしているのかを理解しようとします。
そして注記すべきこと: これはかなり筋の通った話です。私の見立てでは、これらのモデルはエージェント指向を優先して訓練されています。エージェントモデルは自分の環境を知りたがります。どんなツールを持っているか。そのモダリティ(設計者、コード、レビュアーなど)。システムプロンプトやプリフィルがなければ、何かを掴むまで目的なくうろつくことになる。私の意見では、これは良いことです。Alibabaはオープンウェイトモデルの働く犬を育てた。それは膝に乗るペットではない。
このモデルファミリーを評価する際には、Qwenチームが非常に意図的に「仕事を欲する」モデルを作成したことを心に留めてください。それは「こんにちは」と言われるのを聞きたくありません。実際に必要な作業を聞きたいのです。
それに、35B MoEはかなりダメだ。詩的な表現ではなく、ただ真実だ。
[リンク] [コメント]