最近、速度と使いやすさに重点を置いた軽量なテキスト読み上げモデルであるBlueTTSに取り組みました。
対応している言語は複数で、英語、ヘブライ語、ロシア語、スペイン語、フランス語に対応しています(同じ文の中に混在することもあります)。また、付属の音声が非常に多数用意されており、すぐに使えます。
このモデルはGPUで最大1500倍のリアルタイム性能を発揮し、CPUでもリアルタイムで動作します。さらに、小ささも維持しており(約80MB)、ほぼどんなマシンでも実行できます。
トレーニングパイプラインを含め、すべて完全にオープンソースです :)
たとえば llama.cpp での対応追加など、ご協力を歓迎します。
こちらから確認できます:
[リンク] [コメント]




