Qwen 3.5 122B vs Qwen 3.6 35B—どちらを選ぶべき？

Reddit r/LocalLLaMA / 2026/4/20

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

Redditの投稿者は、Qwen 3.5 122BとQwen 3.6 35BをEvalsやベンチマークで直接比較した人がいるかを質問し、OpenWebUIでのコーディング／チャット用途を重視しています。
35Bはサイズが小さいため速度は高いはずだとしつつ、122Bに比べてコーディング品質や総合インデックスで同等以上かどうかの根拠を求めています。
Artificial Analysisの結果として、35Bがコーディング、エージェント的ユースケース、一般的なインデックスで122Bより高く評価されている点を挙げ、長時間のツール呼び出しタスクで122Bが上回らないのかを懸念しています。
投稿は「これまでの経験」を共有してもらうことに焦点があり、長時間のツール呼び出しでの知的さ（IQのような体感）をより保てるのはどちらかを問いかけています。

みなさんこんにちは、
評価（Evals）とベンチマークの両方で両者を試して、違いを確認した人はいますか？

私はDGX Spark 128GBのマシンを使っていて、コーディング（Opencode）とチャット（Openwebui）にどのモデルを選ぶべきか検討しています。もちろん速度は35Bのほうが高いはずですが、この2つのモデルについてベンチマークでの品質とパフォーマンスを確認した人はいますか？みなさんの経験を教えてください。

Artificial Analysisでは、コーディング、エージェント型ユースケース、そして総合インデックスにおいて、35Bが122Bより3.5ではなく3.6で上回っています。

ただ、長時間にわたるツール呼び出し（tool calling）のタスクに関しては、3.6の結果よりも悪くなるのではないかと心配しています。また、その「知性」/ IQについてはどうでしょうか。これまでの経験を教えてください。

によって投稿されました /u/Storge2
[link] [comments]

Black Hat USA

AI Business

ブラックハット・アジア

AI Business

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

Reddit r/MachineLearning

エンタープライズAI戦略コンサルティング

Dev.to

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

Dev.to

Qwen 3.5 122B vs Qwen 3.6 35B—どちらを選ぶべき？

要点

関連記事

Black Hat USA

ブラックハット・アジア

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

エンタープライズAI戦略コンサルティング

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer