Mistral AI は、音声生成への同社初の大きな進出を示すオープンウェイトのテキスト読み上げ(TTS)モデル「Voxtral TTS」をリリースしました。文字起こしおよび言語モデルのリリースに続き、Mistral は現在、音声スタックの最終「‘output layer’(出力層)」を提供しており、開発者エコシステムにおける独自の音声APIに対する直接の競合として位置付けています。 […]
この投稿 Mistral AI Releases Voxtral TTS: A 4B Open-Weight Streaming Speech Model for Low-Latency Multilingual Voice Generation は、MarkTechPost に最初に掲載されました。




