みなさんこんにちは。
Pocket TTSがついにマルチリンガルモデルをリリースしました。
対応言語は6つで、英語、フランス語、スペイン語、ドイツ語、イタリア語、ポルトガル語です。
そして各言語は個別のモデルとして分かれています。
私は、マルチリンガル版に対応するためにonnxエクスポーターの改修を行っています。
これはKevinAHMのonnxエクスポーターと、VolgaGermのPocket TTS cpp最適化をベースにしています。
また、ノードをint8に選択的に量子化することで、より高速かつ安定した生成を実現しています。
int8モデルでの最初のベンチマーク結果です:
AMD Ryzen 9 7950X:レイテンシは約30ms、生成速度は最大でリアルタイムの13倍。
Helio G99:レイテンシは約100ms、生成速度はリアルタイムの2.5倍。
こちらがエクスポータースクリプトです: Pocket TTS ONNX
そしてUnityエンジンでのサンプルランナーはこちら: Pocket TTS Unity
手軽に試したい場合は、すでにAndroid版も用意しています。
[link] [comments]




