Pocket TTS 多言語アップデート

Reddit r/LocalLLaMA / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Pocket TTSが、6言語(英語、フランス語、スペイン語、ドイツ語、イタリア語、ポルトガル語)に対応したマルチリンガルTTSモデルをリリースし、言語ごとにモデルが分かれている。
  • マルチリンガル版をサポートするためのONNXエクスポータの対応が進められており、既存のONNXエクスポータ作業やPocket TTSのC++最適化をベースにしている。
  • エクスポータはノードを選択的にint8量子化することで、より高速かつ安定した音声合成を狙っている。
  • 初期ベンチマークでは、AMD Ryzen 9 7950Xで最大約13倍のリアルタイム速度向上が見られ、レイテンシはデスクトップで約30ms、Helio G99で約100msだった。
  • エクスポータ用のリポジトリ、Unity向けのサンプル実行環境、そしてテストしやすいAndroid版も提供されている。

みなさんこんにちは。

Pocket TTSがついにマルチリンガルモデルをリリースしました。
対応言語は6つで、英語、フランス語、スペイン語、ドイツ語、イタリア語、ポルトガル語です。
そして各言語は個別のモデルとして分かれています。

私は、マルチリンガル版に対応するためにonnxエクスポーターの改修を行っています。
これはKevinAHMのonnxエクスポーターと、VolgaGermのPocket TTS cpp最適化をベースにしています。
また、ノードをint8に選択的に量子化することで、より高速かつ安定した生成を実現しています。

int8モデルでの最初のベンチマーク結果です:
AMD Ryzen 9 7950X:レイテンシは約30ms、生成速度は最大でリアルタイムの13倍。
Helio G99:レイテンシは約100ms、生成速度はリアルタイムの2.5倍。

こちらがエクスポータースクリプトです: Pocket TTS ONNX

そしてUnityエンジンでのサンプルランナーはこちら: Pocket TTS Unity

手軽に試したい場合は、すでにAndroid版も用意しています。

submitted by /u/RowGroundbreaking982
[link] [comments]