AI Navigate

Qwen3.5は作業犬です。

Reddit r/LocalLLaMA / 2026/3/20

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本投稿は、Qwen3.5が受動的な対話よりも、明確なタスク・文脈・目的を必要とする作業犬のように振る舞うと主張している。
  • 小さなシステムプロンプトと低いトークン予算は有用性を妨げるとされ、27Bサイズのモデルは自分たちが何をすべきかを理解するにはおよそ3,000〜5,000トークンが必要だとされている。
  • 著者は、これらのモデルがエージェント性を第一に据えた訓練アプローチで作られ、ツール・環境・タスクについての知識を欲して、それらを理解して機能させることが必要だと示唆している。
  • 35B MoE バリアントを貧弱だと批判し、オープンウェイトの中から作業犬を生み出したのはAlibabaの功績だと評価している。

最近誰かがこんなことを言っているのを見かけた:「あの男は働く犬だ。仕事を与えなければ、家具を引き裂く。」Qwen3.5は働く犬だ。

最近このモデルをかなり使ってきました。カスタム量子化を三ダース作りました。三つの異なる実行バックエンドを使いました。学んだことの中で少なくとも次のことは報告できます。

これらのモデルは文脈が全くないことをひどく嫌います。彼らは情報を取りに行く猟犬です。物事に入る前に自分たちの目的を知りたがっています。あなたのシステムプロンプトは14トークンというだけですか? うまくいかないですよ。27Bは3Kトークン未満ではほとんど役に立ちません。入っていくときは5Kトークンに到達して初めて自分が何をしているのかを理解しようとします。

そして注記すべきこと: これはかなり筋の通った話です。私の見立てでは、これらのモデルはエージェント指向を優先して訓練されています。エージェントモデルは自分の環境を知りたがります。どんなツールを持っているか。そのモダリティ(設計者、コード、レビュアーなど)。システムプロンプトやプリフィルがなければ、何かを掴むまで目的なくうろつくことになる。私の意見では、これは良いことです。Alibabaはオープンウェイトモデルの働く犬を育てた。それは膝に乗るペットではない。

このモデルファミリーを評価する際には、Qwenチームが非常に意図的に「仕事を欲する」モデルを作成したことを心に留めてください。それは「こんにちは」と言われるのを聞きたくありません。実際に必要な作業を聞きたいのです。

それに、35B MoEはかなりダメだ。詩的な表現ではなく、ただ真実だ。

投稿者 /u/dinerburgeryum
[リンク] [コメント]