DeepSeek R1が出てから1年ほど前のことを覚えていますが、それがかなり素早くLlama 3 8bやQwen 2.5(?)7bに蒸留されていきました。なぜもっと蒸留モデルを見かけないのでしょうか?費用はいくらくらいかかりますか?どれくらいのトークンやプロンプトが必要ですか?
[リンク] [コメント]
Reddit r/LocalLLaMA / 2026/5/9
DeepSeek R1が出てから1年ほど前のことを覚えていますが、それがかなり素早くLlama 3 8bやQwen 2.5(?)7bに蒸留されていきました。なぜもっと蒸留モデルを見かけないのでしょうか?費用はいくらくらいかかりますか?どれくらいのトークンやプロンプトが必要ですか?