NemotronのSuperファミリーのモデルについて多くの議論が交わされていますが、最新の追加である Nemotron Cascade 2 30B-A3B(同程度のサイズにもかかわらず Qwen アーキテクチャに基づいていない、 Nemotron自身のアーキテクチャに基づく適切なハイブリッドモデルです)は、ほとんど注目を集めていません。
最近、ローカルモデルの評価をいくつか実行しています。私はいわゆる「雰囲気で判断する」基準で評価する方法には少しうんざりしています。私がかなり気に入っている組み合わせは HumanEval + ClassEval で、実行が速く、ほとんどの小型モデルでもまだ顕著な違いが現れる程度に複雑だからです。だから、mradermacher の IQ4_XS の量子化を試してみました。
HumanEval では Cascade 2 が驚異的な 97.6%、中型の Qwen3.5 モデルを後ろに置き去りました。同様に ClassEval でも 88% という立派なスコアを獲得しました。
このモデルについてもう少しテストを行うつもりですが、もう少し注目に値すると感じています。
[リンク] [コメント]




