同じファミリーのモデル(例:qwen3.5 moes)を使うとしたらどうなるのか気になっています。そして、コア数は異なるものの、サイズは似ている異なる量子化のggufを比較しました。
タスクに対して、どのモデルがより良いのでしょうか?もし差があるなら、私は主にコーディングとツール呼び出しに関心があります。
例として、qwen3.5 122b ud-iq2_xxs は36.6gbで、Qwen3.5 35b q8_0 は36.9gbです
コーディング/ツール呼び出しではどちらがより良いですか?
同じ質問の趣旨に沿って、kimi 2.6 のような非常に大きいモデルを1bit精度で動かすのと、より小さいモデルをより高い精度で動かすのでは、どれくらい興味深い(価値がある)のでしょうか。
[リンク] [コメント]




