Mistral AIが自分の声をクローンして使えるテキスト音声合成AIモデル「Voxtral TTS」を発表、9言語に対応し爆速読み上げ&軽量&オープンソースで利用可能

GIGAZINE / 3/27/2026

📰 NewsIndustry & Market MovesModels & Research

Key Points

  • Mistral AIは、自分の声をクローンして使えるテキスト音声合成(TTS)モデル「Voxtral TTS」を発表しました。
  • 9言語に対応し、爆速読み上げをうたいつつ、軽量で利用しやすい構成になっています。
  • オープンソースとして利用可能で、開発者が音声生成機能を自前に組み込みやすくなります。
  • 声の個別性(声クローン)をTTSに取り込みつつ、性能と実装負荷の両立を狙う動きとして注目されます。


フランスのAI企業・Mistral AIが、自然で感情豊かな音声を生成できるテキスト読み上げモデル「Voxtral TTS」を発表しました。主要な9言語に対応しているほか事前学習のいらない「ゼロショットクローンボイス再生」が可能で、文脈を理解して巧みな感情表現を行う音声を爆速で生成することができます。

続きを読む...

Continue reading this article on the original site.

Read original →
広告