もしあなたが私の立場だったら、何を選びますか?エージェント型コーディングにおいて125kは本当に実用的でしょうか?「コンパクト」は本当にそれで十分なのでしょうか、それともQ6_K 125kを選びますか?
私の5090では、どちらの構成でもおおよそ165〜170トークン/秒出ています。
[リンク] [コメント]
Reddit r/LocalLLaMA / 2026/4/18
もしあなたが私の立場だったら、何を選びますか?エージェント型コーディングにおいて125kは本当に実用的でしょうか?「コンパクト」は本当にそれで十分なのでしょうか、それともQ6_K 125kを選びますか?
私の5090では、どちらの構成でもおおよそ165〜170トークン/秒出ています。