HELP - どの設定を使っていますか？ Qwen3.5-35B-A3B

Reddit r/LocalLLaMA / 2026/3/21

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

共有:

要点

この投稿は llama.cpp を用いて 16GB の GPU 上で Qwen3.5-35B-A3B を設定する方法について議論しており、推奨設定と量子化サイズを尋ねています。
現在の設定を示すために、多数のフラグを含む具体的な llama-server のコマンドラインが含まれています。
著者はより大きな量子化サイズが可能かどうかを疑問視しており、モデルに対するコミュニティの関心を指摘しています。
Reddit 上の実用的なユーザー投稿による問い合わせで、新しいAIリリースを求めるものではなく、セットアップのガイダンスを求めています。

I have a 16GB 9070xt , what settings do you use and what quant size for Qwen3.5-35B-A3B?

I see every alot of people giving love to Qwen3.5-35B-A3B, but i feel like im setting it up incorrectly. Im using llama.cpp

Can i go up a size in quant?

cmd: C:\llamaROCM\llama-server.exe --port ${PORT} -m "C:\llamaROCM\models\Huihui-Qwen3.5-35B-A3B-abliterated.i1-IQ4_XS.gguf" -c 8192 -np 1 -ngl 99 -ncmoe 16 -fa on --temp 0.7 --top-k 20 --top-p 0.95 --min-p 0.00 --flash-attn on --cache-type-k f16 --cache-type-v f16 --threads 12 --context-shift --sleep-idle-seconds 300 -b 4096 -ub 2048

submitted by /u/uber-linny
[link] [comments]

Visual Studio Code拡張機能

Azure OpenAI Service ドキュメント

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

AIを活用して1日で1か月分のコンテンツを作成する方法（ステップバイステップ・システム）

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

AIが植物のケアを変える方法 — そしてそれが重要な理由

Dev.to

HELP - どの設定を使っていますか？ Qwen3.5-35B-A3B

要点

関連記事

Visual Studio Code拡張機能

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

AIを活用して1日で1か月分のコンテンツを作成する方法（ステップバイステップ・システム）

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

AIが植物のケアを変える方法 — そしてそれが重要な理由

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer