Google は、音声の品質、表現力のある制御、そして多言語生成の向上に焦点を当てたプレビューのテキスト読み上げモデル「Gemini 3.1 Flash TTS」を導入しました。単純な変換を優先していたこれまでの反復とは異なり、このリリースでは、自然言語の音声タグ、70 以上の言語に対するネイティブ対応、そしてネイティブのマルチスピーカー対話を重視しています。このリリースは、‘ブラックボックス’ の音声生成から […]
この記事 Google AI Launches Gemini 3.1 Flash TTS: A New Benchmark in Expressive and Controllable AI Voice は、最初に MarkTechPost に掲載されました。




