【リリース】初めてのTTSモデル「Flare-TTS 28M」を公開

Reddit r/LocalLLaMA / 2026/5/2

📰 ニュースTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • 新しいオープンソースのTTS(text-to-speech)モデル「Flare-TTS 28M」が開発者によって公開されました。
  • このモデルは、NVIDIA A6000を1台のGPUとして約24時間、約300エポック、LJSpeechの全データセットを使い、スクラッチから学習されたとのことです。
  • Hugging Faceのモデルリンクと音声の例が提示されており、英語を話せる一方でまだややロボットっぽい音に聞こえると述べられています。
  • 利用者が試したり活用したりできるように、無料かつオープンソースとして提供されています。

やあ r/LocalLLaMA !

新しいモデルを持って戻ってきました。今日は特別なものです

Flare-TTS 28Mです。私の最初の音声合成(TTS)モデルで、単一のA6000 GPUで約24時間、約300エポック、そしてLJSpeechの全データセットを使って、完全に最初からトレーニングしました!

HFモデルへのリンク:https://huggingface.co/LH-Tech-AI/Flare-TTS-28M

サンプル結果:
https://cdn-uploads.huggingface.co/production/uploads/697f2832c2c5e4daa93cece7/vluuHSnp9Ietk7Uk1-hvG.mpga

英語を話しますが、まだ少しだけロボットっぽいです

使いたければどうぞ。無料でオープンソースです

楽しんでください ❤️

投稿者 /u/LH-Tech_AI
[リンク] [コメント]