私が読んできた内容(そしてこれについて私が相談したすべてのモデル)によると、総意としては、Min P はサンプリングにおけるより良く/より現代的なアプローチであり、Top P/Top K よりも優先して使うべきで、Min P が利用できない場合、またはレガシー上の理由がある場合にのみ Top P/Top K を使うべきだ、ということのようです...
しかし、huggingface などで最近公開された LLM を見てみると、サンプリングの推奨パラメータは依然としてほとんどが Top K あるいは Top P です。これは単にレガシー上の理由なのでしょうか?それとも別の理由があるのでしょうか?
[リンク] [コメント]




