xAIの「Custom Voices」機能、1分の音声から実用的なボイスクローンを作成可能に

THE DECODER / 2026/5/2

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • xAIは、AIアプリ向けに自分の声に合わせたボイスクローンを作れる新機能「Custom Voices」を提供開始しました。
  • この機能は、約1分の発話から実用的なクローン音声を生成でき、カスタムボイスの設定をより手軽にします。
  • 「Custom Voices」は、最近公開されたGrokのSpeech-to-TextおよびText-to-Speech APIをベースにしており、既存の音声処理の流れを拡張しています。
  • 今回のアップデートは主に開発者向けの追加機能として位置づけられ、パーソナライズされた音声体験を製品やサービスに組み込みやすくします。
  • ボイスクローンに必要なデータ量や時間を抑えることで、TTSや会話型AIの活用シーンが広がる可能性があります。

xAIは、開発者がAIアプリケーション向けに自分自身の声をクローンできるようになりました。新しい「Custom Voices(カスタムボイス)」機能は、最近リリースされたGrokの音声認識(Speech-to-Text)および音声合成(Text-to-Speech)APIの上に構築されています。

この記事 xAIの新しいCustom Voices機能は、1分間の発話を実用的な声のクローンに変えるThe Decoder に最初に掲載されました。