Gemini 3.1 Flash Live:音声AIをより自然で信頼性の高いものにする

Google Blog / 2026/3/27

📰 ニュースTools & Practical UsageModels & Research

要点

  • Gemini 3.1 Flash Liveは、音声ベースのAI会話をリアルタイム利用でより自然に、かつ確実にすることを目的としたアップデートとして位置づけられています。
  • この記事では、オフラインのテキスト生成だけにとどまらず、音声インタラクションの品質、信頼性、ユーザー体験の向上に焦点を当てています。
  • 「Live」の音声パフォーマンスを重視することで、タイミング、応答の速さ、継続性がモデルの有効性にとって重要となるシナリオをターゲットにしています。
  • 投稿では、この取り組みをGoogleのより広範なGeminiモデル群と、多様なモーダル体験をより高い能力で実現するための研究の方向性の一部として位置づけています。
  • 重要なポイントは、開発者やプロダクトチームが、Gemini 3.1 Flash Liveシリーズによるより良い音声/オーディオの会話パフォーマンスを期待できるという点です。

Gemini 3.1 Flash Live:音声AIをより自然で信頼性の高いものに

2026年3月26日

·

最新の音声モデルでは、精度が向上し、レイテンシが低下したことで、音声によるやり取りがよりスムーズで自然かつ正確になりました。

Valeria Wu
プロダクトマネージャー
Yifan Ding
Geminiチームの一員としてのソフトウェアエンジニア
返却形式: {"translated": "翻訳されたHTML"}
AIが生成した要約を読む

概要

Gemini 3.1 Flash Live は、自然で信頼性の高いリアルタイム対話を実現するために設計された、Google の最高品質の音声モデルです。開発者は Google AI Studio の Gemini Live API から利用できます。企業は顧客体験のために活用できます。誰でも Search Live と Gemini Live を通じて体験でき、これらは現在 200 以上の国と地域に対応しています。

要約は Google AI によって生成されました。生成AIは実験段階です。

要点

  • 「Gemini 3.1 Flash Live」が登場し、AI の音声がより自然で信頼性の高いものになりました。
  • この新しい音声モデルはより高速で、自然な会話のためのトーンの理解にも優れています。
  • 開発者は、複雑なタスクをより確実に処理できる音声エージェントを構築するために利用できます。
  • Gemini Live と Search Live は、多くの言語でより役立つ回答を提供します。
  • 3.1 Flash Live のすべての音声にはウォーターマークが付けられており、不正確な情報の拡散を防ぐのに役立ちます。
要約は Google AI によって生成されました。生成AIは実験段階です。

他のスタイルを探す:

  • 概要
  • 要点
Geminiのエンブレムが『Gemini 3.1 Flash Live』というテキストの横に表示されています。背景には、青色で多彩なドットがあり、マイクのアイコンを構成しています

お使いのブラウザは audio 要素をサポートしていません。

記事を聞く
このコンテンツは Google AI によって生成されています。生成AIは実験段階です
[[duration]]分
音声 速度
音声
速度 0.75X 1X 1.5X 2X

本日、Gemini 3.1 Flash Live によって、Gemini のリアルタイム対話機能を前進させます。これは、当社におけるこれまでで最高品質のオーディオおよび音声モデルです。次世代の「音声を起点とするAI」に必要な速度と自然なリズムを提供し、開発者、企業、日常の利用者にとってより直感的な体験を実現します。

3.1 Flash Live は、Google の各種プロダクトで利用可能です:

開発者向け:堅牢な推論とタスク実行

当社は、3.1 Flash Live の全体的な品質を改善し、スケールに応じて複雑なタスクを完了できる音声起点のエージェントを、開発者および企業がより信頼性高く構築できるようにしました。ComplexFuncBench Audio は、さまざまな制約の下でのマルチステップの関数呼び出しを捉えるベンチマークで、これまでのモデルと比べてスコア 90.8% でトップです。

ComplexFuncBenchオーディオ棒グラフ
BigBenchAudio棒グラフ

Scale AI の Audio MultiChallenge では、「thinking(考える)」がオンの状態で、Gemini 3.1 Flash Live が 36.1% のスコアでトップです。このベンチマークは、特に複雑な指示の追従と、現実世界の音声に典型的な割り込みやためらいの中での長期的な推論をテストします。

AudioMultiChallenge棒グラフ

3.1 Flash Live では、より自然な対話を実現するために、音調(トーン)の理解も改善されています。Gemini Enterprise for Customer Experience では、2.5 Flash Native Audio よりも、ピッチや話すテンポといった音響のニュアンスの認識においてさらに効果を発揮します。また、ユーザーが苛立ちや混乱を示したときに、それに応じて応答を動的に調整する点でも優れています。

3.1 Flash Live を使えば、騒がしい環境でも複雑なタスクを処理できる、音声対応のエージェントを構築できます。

Gemini 3.1 Pro を使用して構築した、説明目的のデモンストレーション。Gemini 3.1 Flash Live によって駆動されています。

3.1 Flash Live では、声でバイブ・コードを行い、すばやく反復(改善)できます。

Gemini 3.1 Pro を使用して構築した、説明目的のデモンストレーション。Gemini 3.1 Flash Live によって駆動されています。

Verizon、LiveKit、The Home Depot などの企業が、自社の業務フローにおいて 3.1 Flash Live に対して好意的なフィードバックを寄せており、改善された自然な会話が強調されています。

The Home Depot からの引用
Verizon からの引用
LiveKit からの引用
Wavera からの引用
Stream からの引用
YouTube からの引用

誰にとっても:より自然で直感的なやり取りを

Gemini Live と Search Live では、3.1 Flash Live モデルが、ちょっとした毎日の質問をするときでも、より複雑な会話に参加するときでも、より役立つ自然な応答を提供します。

内部で 3.1 Flash Live モデルを採用することで、Gemini Live は従来のモデルよりも速い応答を実現し、会話の流れをこれまでの 2 倍の長さにわたって追跡できるようになります。これにより、長時間のブレスト中でも思考の筋道をそのまま保てます。

3.1 Flash Live は Gemini Live をより速く、より役立つものにする

3.1 Flash Live は本来的に多言語対応でもあります。これにより、今週の Search Live のグローバル展開が可能になります。この提供開始により、200 以上の国・地域の人々が、好みの言語で Search とリアルタイムのマルチモーダル会話をできるようになります。

Search Live で 3.1 Flash Live を使い、リアルタイムのトラブルシューティング支援を受けましょう

Gemini 3.1 Flash Live を試してみる

3.1 Flash Live によって生成されたすべての音声には SynthID が透かしとして埋め込まれています。この目に見えない透かしは、音声出力に直接織り込まれており、AI 生成コンテンツを確実に検出できるため、誤情報の防止に役立ちます。安全性と責任に対するアプローチの詳細については、モデルカードをご覧ください。

3.1 Flash Live の自然さと信頼性を、今日から体験してください。皆さんがどのようにやり取りし、どのように活用していくのかを楽しみにしています。

受信箱で Google の最新ストーリーをもっと受け取る。 受信箱で Google のストーリーをもっと受け取る。

メールアドレス

お客様の情報は Google のプライバシー ポリシー に従って使用されます。

購読する

完了です。もう 1 ステップだけ。

購読を確認するため、受信箱を確認してください。

すでにニュースレターを購読しています。

次の方法でも購読できます: 別のメールアドレス

掲載先: