GoogleがGemini 3.1 Flash TTSを発表:表現力と制御性における新たなベンチマーク

MarkTechPost / 2026/4/16

📰 ニュースSignals & Early TrendsModels & Research

要点

  • Googleは、音声品質の向上と、より表現力があり制御可能なオーディオの提供を目指したテキスト読み上げモデル「Gemini 3.1 Flash TTS」をプレビューしました。
  • このモデルは、単なる音声変換から、生成の制御性を高めるために自然言語の音声タグを用いることへ重点を移しています。
  • Gemini 3.1 Flash TTSは、70言語以上での多言語出力に対応し、グローバルな利用可能性の拡大を狙っています。
  • さらに、ネイティブな複数話者による対話生成も備えており、合成音声でよりダイナミックな会話を実現します。

Google は、音声の品質、表現力のある制御、そして多言語生成の向上に焦点を当てたプレビューのテキスト読み上げモデル「Gemini 3.1 Flash TTS」を導入しました。単純な変換を優先していたこれまでの反復とは異なり、このリリースでは、自然言語の音声タグ、70 以上の言語に対するネイティブ対応、そしてネイティブのマルチスピーカー対話を重視しています。このリリースは、‘ブラックボックス’ の音声生成から […]

この記事 Google AI Launches Gemini 3.1 Flash TTS: A New Benchmark in Expressive and Controllable AI Voice は、最初に MarkTechPost に掲載されました。