qwen3.5 27Bモデルに対するもう一つの感謝（評価）投稿

Reddit r/LocalLLaMA / 2026/3/24

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

共有:

要点

Reddit投稿者が、ローカル開発用途でQwen3.5 27B（各量子化版）やQwen3.5 122B、Nemotron-3 Super 120B、gpt-oss 120b、さらにgpt-5.4 highとの比較テストを実施し、総合的な出来を報告した。
結果としてNemotron-3 Super 120Bはgpt-5.4 highと同等レベルで非常に良く、Qwen3.5 25Bも健闘した一方、gpt-oss 120bとQwen3.5 122Bは相対的にパフォーマンスが低かったという。
投稿者の環境（RTX 3090を複数）では、Qwen3.5 27BのQ6（Q6_K_XL）を実開発タスクで現実的に運用でき、追加ハード投資なしで済む点を大きな利点としている。
併せて、vast.ai上での稼働条件（context長やトークン生成速度など）と、llama.cpp/llama-serverでの実行コマンド例を共有し、ローカル運用の再現性を高めている。
APIサブスクリプションの置き換え（少なくとも日常的タスク）に繋がる可能性があるとして、複雑タスクでは引き続きCODEXを使う方針も述べている。

qwen3.5 122bが出たときにテストしましたが、本当に気に入りました。開発テストの用途では、（コーディング用の現行AIツールである）gemini 3 flashといい勝負でした。なのでハードウェアに投資しようと思ったのですが、問題は新しいマザーボードが必要で、さらに（1台、または追加で）3090を2枚ほしいという点です。とはいえ、現状の価格があまりにも高すぎます。

qwen3.5 27bのほうが122bより優れていると言う投稿をたくさん見かけましたが、正直それは私にはしっくり来ませんでした。次にnemotron 3 super 120bを見つけましたが、「qwen3.5 122bより良いわけではない」と言っている人がいて、私はそれを信じました。

昨日と今日、これらのモデルをすべてテストしました：

"unsloth/Qwen3.5-27B-GGUF:UD-Q4_K_XL"
"unsloth/Qwen3.5-35B-A3B-GGUF:UD-Q4_K_XL"
"unsloth/Qwen3.5-122B-A10B-GGUF"
"unsloth/Qwen3.5-27B-GGUF:UD-Q6_K_XL"
"unsloth/Qwen3.5-27B-GGUF:UD-Q8_K_XL"
"unsloth/NVIDIA-Nemotron-3-Super-120B-A12B-GGUF:UD-IQ4_XS"
"unsloth/gpt-oss-120b-GGUF:F16"

比較しやすいように、gpt-5.4 highに対してもテストしました。

私の驚きですが、nemotronは非常に、非常に良いモデルで、gpt-5.4といい勝負でした。さらにqwen3.5-25bもかなり良い出来でした。

残念ながら（しかしそれも良い点で）gpt-oss 120bとqwen3.5 122bは、他の2つのモデルよりも成績が悪かったです（より多くのハードウェアが必要になるので、ある意味納得できます）。

なので、実開発タスクをローカルで行うために「Qwen3.5-27B-GGUF:UD-Q6_K_XL」をようやく本格的に使えます。ベストなのは、これ以上ハードウェアを買い足す必要がないことです（すでに3090を2枚持っています）。

十分な情報を提供できなくてすみませんが、全モデル分のtg/ppは保存していませんでした。nemotronは80 tg、約2000 ppで動作し、4枚のrtx 3090とvast.ai上で100k context、Qwen3.5-27BのQ6は803ppで25 tg、256k contextでした（こちらもvast.aiです）。

おそらく来週には、生産利用のためにローカル環境でセットアップする予定です。

以下が私が使ったコマンドです（ほぼunslothのページからコピペです）：

./llama.cpp/llama-server -hf unsloth/Qwen3.5-27B-GGUF:UD-Q6_K_XL --ctx-size 262144 --temp 0.6 --top-p 0.95 --top-k 20 --min-p 0.00 -ngl 999

追伸：

実際にAPIサブスクリプションを（少なくとも日々のタスクに関しては）置き換えられることが嬉しいです。複雑なタスクには引き続きCODEXを使います。

もし、nemotron-3-super 120bが必要とするハードウェアが手元にあれば、こちらを代わりに使っていたでしょう。ほかのモデルは英語で返答していたのに対し、nemotronは私の言語（スペイン語）で常に応答してくれました。

submitted by /u/robertpro01
[link] [comments]

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

世界半導体売上高、単月で初めて800億ドル突破 26年1月

日経XTECH

TSMC、光電融合でライバル突き放しへ半導体の設計情報「PDK」を広く提供

日経XTECH

qwen3.5 27Bモデルに対するもう一つの感謝（評価）投稿

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

世界半導体売上高、単月で初めて800億ドル突破 26年1月

TSMC、光電融合でライバル突き放しへ半導体の設計情報「PDK」を広く提供

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

世界半導体売上高、単月で初めて800億ドル突破 26年1月

TSMC、光電融合でライバル突き放しへ 半導体の設計情報「PDK」を広く提供

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

TSMC、光電融合でライバル突き放しへ半導体の設計情報「PDK」を広く提供