電話で話すのは、すべての社交的な状況において適切ではありません。
中程度の性能の電話で動かせるSTTモデルで、ささやき声の発話を認識するのが得意なものはどれですか?
既存のSTTモデルを、ささやき声の発話の認識がより得意になるように微調整(finetune)できますか?
ありがとうございます。
[リンク] [コメント]
Reddit r/LocalLLaMA / 2026/5/20
電話で話すのは、すべての社交的な状況において適切ではありません。
中程度の性能の電話で動かせるSTTモデルで、ささやき声の発話を認識するのが得意なものはどれですか?
既存のSTTモデルを、ささやき声の発話の認識がより得意になるように微調整(finetune)できますか?
ありがとうございます。