AI Navigate

Unsloth の Qwen3.5-35B-A3B-UD-IQ4_XS についての簡潔な所感

Reddit r/LocalLLaMA / 2026/3/20

💬 オピニオンTools & Practical Usage

要点

  • 著者は新しい Oobabooga インターフェースで Qwen3.5-35B-A3B-UD-IQ4_XS をテストし、前処理をほとんど行わず、3090 上で約 100 トークン/秒と報告しています。
  • GPU 上でキャッシュ量子化なしで約 250,000 のコンテキスト長を扱えるため、長期的な生成を可能にします。
  • モデルは時には誤りを犯しますが、概ね指示に従い、実用的な成果を提供する能力が高く、目標志向のタスクに対して強い適性を示しています。
  • その高速性と大きなコンテキストのため、エージェント的なワークフローやローカルツール(例: Cline)と相性が良いと予想しています。
  • モデルを使った実践的なデモを示すための CodePen デモ(3D Snake)が用いられています。

新しいバージョンの Ooba で動作するようになった後、Qwen3.5-35B-A3B-UD-IQ4_XS についての簡単な感想をいくつか。

3D Snake

この種のものは簡単そうに思えるが、多くのモデルは新しい文脈と私が比較的容易に提供できる手掛かりを与え直しても、全体を壊さずに変更することを拒んだ。 このモデルは違っていた。いくつかのミスを犯し、時には考えるのに時間がかかる場面もあったが、実際には欠陥を修正して動作する製品を届けた。 小さなモデルで最も望めるのは、指示に従う能力が高く、かなりよく定義された目標を適切に実行することだと思うが、このモデルはそれをよくこなしているように見える。 私はまだ Cline で試していないが、適切なエージェント的ワークフローではかなりうまくいくと予想している。 Cline は文脈を横取りする面があるので、能力が高く非常に速い、GPU 上で巨大な未量子化コンテキストを収容できるローカルモデルと組むのが良い組み合わせになると思う。

投稿者 /u/EuphoricPenguin22
[リンク] [コメント]