やあ、合成データがASRモデルの学習にどれくらい役立つのかを確かめたいと思っています。ベストなTTSは何ですか?ロボットっぽくない、自然な音に聞こえるものを探しています。TTSが英語の訛り(アメリカ英語、イギリス英語、フランス語など)を模倣できるととても嬉しいです。助けてくれてありがとうございます。
[link] [comments]
Reddit r/LocalLLaMA / 2026/4/7
やあ、合成データがASRモデルの学習にどれくらい役立つのかを確かめたいと思っています。ベストなTTSは何ですか?ロボットっぽくない、自然な音に聞こえるものを探しています。TTSが英語の訛り(アメリカ英語、イギリス英語、フランス語など)を模倣できるととても嬉しいです。助けてくれてありがとうございます。