AI Navigate

インサイト最新記事一覧 AI大全

Mistralの最初のオープンウェイトTTSモデル「Voxtral」、9つの言語で3秒の音声から声をクローン

THE DECODER / 2026/3/27

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

原文を読む →

共有:

要点

Mistralは、9つの言語をサポートする初のオープンウェイトのテキスト・トゥ・スピーチ（TTS）モデル「Voxtral」をリリースしました。
Voxtralは、参照用の音声として3秒分だけで話者の声をクローンできます。
今回のリリースにより、Mistralは急成長している音声生成およびTTSツールの分野で、直接的な競合として位置づけられます。
モデルがオープンウェイトであるため、開発者や研究者は音声クローンのワークフローをより容易に実験し、適応できる可能性があります。
9言語対応により、単一の市場や言語にとどまらない、より幅広い実世界での導入シナリオが見込まれます。

フランスのAIスタートアップMistralは、9つの言語をサポートし、音声のたった3秒から声をクローンできる同社初のテキスト読み上げ（TTS）モデル「Voxtral」をリリースしました。

この記事のMistralの初のオープンウェイトTTSモデル「Voxtral」は、9つの言語で音声の3秒から声をクローンするは、The Decoderに初めて掲載されました。

関連記事

三菱電機のデジタル戦略を率いる武田氏、「現場データの背景理解が重要」

日経XTECH

AIで求められる高度な通信品質要件、エッジやスライシングを駆使して確保

日経XTECH

AIエージェントの性能が急上昇、米国でソフト開発者の求人が増え始めた

日経XTECH

AIが考える「最強のプログラミング言語」、実際につくって動かしてみた

日経XTECH

Forge – 開発チームの会話を構造化された意思決定に変える

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。