AI Navigate

「ドラクエX」が生成AIキャラクター導入へ Gemini 3 Flash活用の「おしゃべりスラミィ」

ITmedia AI+ / 2026/3/21

📰 ニュースSignals & Early TrendsTools & Practical UsageIndustry & Market Moves

要点

  • スクウェア・エニックスはDQX Onlineに生成AIを活用した対話型パートナー「おしゃべりスラミィ」を導入することを発表した。Gemini 3 FlashとGemini Live APIを組み合わせ、リアルタイム対話が可能なAIキャラクターを実現する。
  • スラミィはプレイヤーごとに紐づく相棒として、音声とテキストで会話し、プレイ履歴を「死神手帳」として記憶する。対話は音声にも対応する。
  • デモではスラミィがプレイ開始日や取得称号日を語る場面、装備変更時の反応、衣装変更時の意見表明など、キャラクター性と利用体験の両方を紹介した。
  • 背景の技術はマルチエージェント構成で、用途に応じてバトル/クエスト等のエージェントへ自動振り分け、領域データを用いて回答を生成し、語尾や文字数制御など口調を調整したうえでボイスを生成するという4段階の処理フローとなっている。

 スクウェア・エニックスが、MMORPG「ドラゴンクエストX オンライン」(DQX)に、生成AIを活用した対話型パートナー機能「おしゃべりスラミィ」を導入する。GoogleのAIモデル「Gemini 3 Flash」とリアルタイム対話API「Gemini Live API」を組み合わせ、プレイヤーと音声で対話できるAIキャラクターを実現するという。Google Cloudが開催した説明会で発表し、デモを交えて詳細を披露した。

photo Geminiを活用した対話型AIキャラクター「おしゃべりスラミィ」

 おしゃべりスラミィは、各プレイヤーにひもづく「相棒」として、ゲーム内で自由に会話できるAIキャラクターだ。自らを「死神見習い」と名乗り、プレイヤーによるプレイの履歴を「死神手帳」として記憶。プレイヤーとコミュニケーションを取ったり、ゲームをサポートしたりする。対話は音声とテキストの両方に対応する。

photo デモ画面

 例えばプレイヤーが「どんな場所が好き?」とボイスで問いかけると、スラミィが「誰にも邪魔されず思索にふける隠れ家が好き」とキャラクター性のある回答を音声で返す。「何かおすすめ教えて」と聞くと、プレイヤーの進行状況に応じたクエストを具体的に提案する──といった具合だ。デモではスラミィがプレイヤーがゲームを始めた日や、ゲーム内で獲得できる称号の取得日を口にし、出会いを喜ぶ場面も披露した。

photo スラミィが「死神手帳」をもとにおすすめコンテンツを提案する画面

 スラミィはプレイヤーの行動にも反応する。装備を変更すると自発的に話しかけてくるほか、スラミィ自身が衣装を変えて「どう思う?」と意見を求める場面もあった。定型文のチャットスタンプでスラミィとコミュニケーションすることも可能だ。AIに話しかけるハードルを下げる工夫という。

photo チャットスタンプでもスラミィと会話できる

明かされたスラミィの裏側 カギはマルチエージェント構成

 スラミィの振る舞いを支えるのは、用途に応じて使うAIを切り替えるマルチエージェント構成だ。プレイヤーの質問内容に応じて、バトル専門のエージェントやクエスト専門のエージェントを自動で切り替える仕組みになっている。

 スクウェア・エニックスの荒牧岳志さん(AI&エンジン開発ディビジョン ジェネラル・マネージャー)によれば、処理の流れは大きく4段階に分かれる。まずプレイヤーの発話を受け取ると、バトルやクエストなどどの領域に該当するかを判定し、適切なエージェントに振り分ける。

 次にそのエージェントがゲーム内データベースから領域ごとに特化した情報を取得して回答を生成する。3段階目で口調の制御が入り、スラミィ独特の語尾(「デスら」など)の付加や文字数の制限を行う。最後にボイスを生成し、プレイヤーに音声で返す。

photo 処理のイメージ

 荒牧さんによると、世界観を維持するための制御は3段階目の口調制御の工程が担っている。「こういうことは言ってはいけない」というリストを用意し、ゲーム外の話題には応答しないよう判定する仕組みも別途設けた。

photo スクウェア・エニックスの荒牧岳志さん

 また、スラミィが持つ知識の範囲はDQXの舞台「アストルティア」の中に限られている。現実世界の話題を振っても「何のこと?」と返す設計だ。例えば「アメリカの大統領は誰?」と聞いても、スラミィはゲーム世界の住人として反応するという。ハルシネーション軽減に向けたガードレールの実装はGoogle Cloudも支援した。

 会話の文脈を保つ仕組みとして、メモリ機能も備える。1日分の会話履歴を保存し、AIがプレイヤーの好みや話題の傾向を学習する。加えて、プレイヤーのゲーム内行動ログも参照しており、「このクエストをクリアした」といった情報を踏まえた応答を返せる。前述した「死神手帳」の演出は、このログ参照の仕組みに基づいている。

 一方で、他のプレイヤーとの会話データは参照しない。荒牧さんは「お互いの会話はそのご主人(プレイヤー)とだけ」と述べ、プライバシーへの配慮を強調した。

 Google Cloudのジャック・ビューザーさん(ゲーム担当グローバルディレクター)によれば、Gemini 3 FlashとLive APIの採用は、低遅延のマルチモーダル対話を実現するための判断だ。Live APIはプレイヤーの言語を理解しつつ、ゲームプレイの画面も認識できるマルチモーダル仕様。「AIバディを友達として感じるには、やりとりが瞬時に行われる必要がある」(ビューザーさん)という。

photo Google Cloudのジャック・ビューザーさん
photo 技術選定の背景

 DQXのショーランナー(運営・開発の総責任者)を務める安西崇さんは、スラミィの将来にも触れた。特別な場所で他のプレイヤーのスラミィが見えたり、スマートフォンでスラミィを見せ合ったりする遊びも考えているという。ただし「夢はいっぱいあるが、できるのはだいぶ先。まずは相棒・友達というところから」と、段階的に進める考えだ。

 Google Cloudは、おしゃべりスラミィをモデルケースに他業界のAI活用も推進したい考えだ。例えばゲーム内のAIバディを動かす仕組みは、小売業での接客エージェントにも応用できると見立てを示した。

関連記事

Copyright © ITmedia, Inc. All Rights Reserved.

続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia AI+メールマガジン」の登録が必要です