私は llama.cpp 用の自動チューニングスクリプト ik_llama.cpp を作成しました。これは私のような 3090ti + 4070 + 3060 といった変則的なセットアップでも 最大トークン毎秒数 を実現します。
フラグ設定不要、OOMクラッシュともおさらばです、やったね!
Reddit r/LocalLLaMA / 2026/3/11
私は llama.cpp 用の自動チューニングスクリプト ik_llama.cpp を作成しました。これは私のような 3090ti + 4070 + 3060 といった変則的なセットアップでも 最大トークン毎秒数 を実現します。
フラグ設定不要、OOMクラッシュともおさらばです、やったね!