米Googleは3月26日(現地時間)、米国では2025年6月から提供している「Search Live」(日本では「検索Live」)機能を、「AIモード」が利用可能な日本を含むすべての言語と地域で提供開始したと発表した。これにより、AndroidおよびiOSの「Google」アプリから「ライブ」アイコンをタップするだけで、音声やカメラを使ったインタラクティブなリアルタイム対話をユーザーの好きな言語で利用できるようになる。
同日発表の音声対話モデル「Gemini 3.1 Flash Live」により、検索Liveでは自然で直感的な会話が可能になった。このモデルは、以前のモデル(2.5 Flash Native Audio)と比較して、声の高さや話すペースといった音響的なニュアンスを理解する能力が格段に向上しているという。ユーザーの不満や混乱といった感情表現に合わせて動的に応答を調整できるようになったほか、応答自体も高速化し、会話の文脈をこれまでの2倍長く維持できるよう進化した。
検索Liveは、文字入力の手間を省きたい時やリアルタイムのサポートが必要な場面で活用できる。例えば、目の前にある棚の組み立て方が分からない時に、スマートフォンの「Googleレンズ」を起動してカメラで実物を映し、画面下の「ライブ」をタップして音声で質問すると、視覚的な文脈を踏まえた解決策や関連リンクを即座に提示してくれる。
また、文脈を長く保てるため、長時間のブレインストーミングで思考を途切れさせずに議論を深めたい時や、周囲にノイズが多い環境で複雑なタスクをこなす高度な音声エージェントを構築・利用する場面などでも役立つとしている。
関連記事
Google、音声モデル「Gemini 3.1 Flash Live」公開 感情に合わせて自然な対話を実現
Googleは、リアルタイム対話機能を強化した新モデル「Gemini 3.1 Flash Live」を発表した。低遅延かつ高精度なマルチモーダル推論を実現し、音声のニュアンスや感情を汲み取った自然な応答が可能だ。音声には電子透かし「SynthID」を埋め込み、安全性の確保と誤情報拡散の防止を図る。
Google、Gemini活用で翻訳・会話能力を強化 イヤホンでのリアルタイム翻訳も改善
Googleは、Geminiの機能を活用した複数の翻訳・音声関連新機能を発表した。「Gemini 2.5 Flash Native Audio」を導入し、Geminiライブの会話能力を向上。Google翻訳にはGeminiの最先端翻訳機能が導入され、慣用句などの翻訳精度が向上した。また、イヤホンでのリアルタイム音声間翻訳機能や、Duolingoのような言語学習ツールの拡張も行われた。
Googleアプリでの「AI Mode」、音声会話式検索の提供開始(米国で)
Googleが米国で、Googleアプリの新機能「Search Live」の提供を開始した。これは対話型のAI検索「AI Mode」の一部で、音声で質問すると音声で回答が得られる。画面には情報源のリンクが表示される。
スマホのGeminiに“目”がついた AIアシスタントの未来へ一歩前進 無料で誰でも利用可能
米Googleは、AIアシスタント「Gemini」のスマートフォンアプリに対し、カメラに写るものについて音声で質問ができる「Gemini Live」の機能を、全ユーザーに無料で開放した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.
続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia AI+メールマガジン」の登録が必要です

