ええ、また例の“新しくてピカピカ”なモデルですが、前回のSOTAよりも明らかに良いです。あなたが目を白黒させたくなる理由も分かります。最初の24時間は、前回と同じように誇大宣伝だと思ってQwen3.6は無視していました。でも最終的に昨日、その疑念を脇に置いて、Qwen3.5-27Bではどんなに工夫しても解決できなかった問題に対して試してみることにしました。
Qwen3.5-27B-Q4_K_Mは、ほぼ10年使っていたクラウドベースのものを置き換えるための、カスタマイズした家計簿(予算管理)アプリを作るのに役立ちました。支出と収入を追跡し、動的な予算を作成し、銀行口座からのインポート/エクスポート、組み込みのチャート、モダンなインターフェース、そして他にもたくさんの小さな機能があります。
うまく動いていたのですが、機能を追加し続けているうちに、27Bが技術的負債を生み始めていることに気づきました。週に一度くらいはあちこちを少しずつクリーンアップしていましたが、ある時点で壁にぶつかりました。これは100% Opencode の制限だと思いました。というのも27Bが、Qwen3-Next、Gemma4-31B、そしてQwen3.5-122Bでも得られなかった要求をすべて食い潰してしまっていたからです。
Qwen3.6-35B-A3Bが出たとき、以前のQwen3.5-35B-A3Bをテストしていた時間を思い出しました。あれは少なくとも私のプロジェクト要件にとっては、かなり時間の無駄でした。そこから昨日、このスレッドのポジティブな投稿を全部見た後に折れてしまい、また改めて潜り込みたいと思ったんです。
新しい35B、バチバチに良いです!私はそれを、27Bの前の兄が持ち込んだ失敗した実装やバグ全部にぶつけてみましたが、少なくとも最悪でも1-shotまたは2-shotで、それらを解決し続けてくれました。やる気が出てきたので、コードの非効率や、潜在的なセキュリティリスクをすべてレビューして対処するように昇格(プロモート)しました。作業を分割するためにサブエージェントを使わせ、128kのコンテキストウィンドウを絶対に超えないよう指示しました。約20分後には、まず実行すべきことの完璧なレポートを出し、続けてエージェントをBuildモードに切り替えると、そこからさらに30分で全部を対応し終えました。
私の5070 Ti 16GB環境では、Q5_K_XLはかなり良いです。処理は約320t/s、生成は50t/sです。考え込む傾向はあるものの、ループに入ることはめったにありません。まだ“クセ”のある部分もあって、OpencodeにおけるPlanモードを尊重せず、結局ファイルを書いてしまうことがあります。なので当面はそれを避けるために、その周辺をプロモートして対策しました。あなたが疑っていたり、「これは自分向きじゃない」と思っていたなら、とりあえず一度試してみてください。少なくとも時間の無駄にはなりません。
新しいQwenチームが、最後の35Bからこんなにも改善できるなら、新しい27Bはどうなるんだ?!
[link] [comments]

