“自販機が話し出す”未来がすぐそこに!? 進化する「音声AI×ハードウェア」、日本の勝機は

ITmedia AI+ / 4/9/2026

💬 OpinionSignals & Early TrendsIndustry & Market Moves

Key Points

  • 音声AIはコールセンター中心から、葬儀社の受電、災害時避難案内、約400万台の自動販売機など生活の現場・社会インフラ領域へ拡大している。
  • 2026年に向けて、処理能力とメモリを抑えた軽量な小型言語モデル(SLM)により、クラウドなしでエッジデバイス上で動く「オンデバイスAI」が現実化してきた。
  • これにより、ネット接続に依存しない音声対話がスマートフォン等で数年以内に広がり、自販機などのハードウェアへの組み込みも進む見通しだ。
  • 日本の勝ち筋として、感情表現の壁を越えた“おもてなし”を音声AI×ハードウェアの国家戦略として世界へ輸出する構想が語られた(AICX協会の取り組みを含む)。
  • 深刻な人手不足対応(24時間対応・高齢者見守り等)だけでなく、飲料おすすめや災害時の経路案内といった「プラスの価値」創出にも用途が広がる。

 これまではコールセンターでの導入が中心だった音声AIの主戦場が、生活のあらゆる「現場」へと広がっています。深刻な人手不足に悩む葬儀社の受電対応や、災害時の避難案内を担う400万台の自動販売機にまで──その適用範囲はもはや社会インフラの領域に達しようとしています。

 2026年には、処理能力やメモリを抑え、クラウドを介さずエッジデバイス上でも動作できる軽量なAIモデル「小型言語モデル」(Small Language Model、SLM)が台頭してきました。SLMにより、ネット環境を介さない「オンデバイスAI」が現実のものとなってきました。

 AICX協会代表理事の小澤健祐氏に、感情表現の壁を越え、日本独自の「おもてなし」を世界へ輸出するための「音声AI×ハードウェア」の国家戦略を聞きます。前編記事【「プロンプト」はもういらない キーボードを使わない「音声AIエージェント」が“必然”となる理由】に引き続き、聞き手は音声AIスタートアップのVerbex(東京都渋谷区)代表の森下将憲氏。

小澤健祐(おざわ・けんすけ)企業におけるAIエージェントの実装を支援し、顧客体験と業務効率の抜本的な改善を目指す一般社団法人AICX(AI Customer Experience)協会の代表理事。年間300~400回程講演を実施。『生成AI導入の教科書』や『AIエージェントの教科書』など2冊を出版。AICX協会では、防衛装備庁と一緒にAIエージェントの実証実験や、ドクターズという医療系PaaSをやっている会社とパートナーシップを締結して新たな医療ヘルスケアAIによるエコシステムの創出に向けた共創プロジェクトを開始している(写真左は筆者。以下Verbex撮影)

「24時間対応」の限界を突破せよ 切実な現場を救う音声AI

森下: 現在、音声AIの活用はコールセンターなどが中心ですが、深刻な人手不足を背景にニーズは急速に多様化しています。例えば深夜の応対自動化はもちろん、ホテルのチェックイン機や駅の券売機といったハードウェアの完全無人化などですね。さらに、人手に頼らざるを得なかった「高齢者の見守りサービス」にも音声AIを活用したいという声が寄せられるなど、多方面での実装が期待されています。

Verbexの提供資料

小澤: 活用の方向性として、大きく2つあると思っています。1つは「人手不足などマイナスの問題をゼロにしたい」という方向です。

 もう1つは「プラスをどう生んでいくのか」という方向ですね。最近注目しているのが、国内に約400万台ある自動販売機です。例えば飲み物をお薦めする。あるいは災害時に、避難経路の案内を音声でしてくれるといった用途が考えられます。

 背景にLLM(大規模言語モデル)だけでなく、徐々にSLMの存在感が増している現状があります。音声AIに関しても、今後はクラウドではなくオンデバイスで処理できるようになっていくと思います。ネットにつながなくても、スマートフォンなどと対話できる未来がおそらく数年以内にやってきます。もちろん自動販売機にも組み込めます。

SLMがもたらす「オンデバイスAI」 日本の勝ち筋とは?

森下: SLMやオフラインで動く「ローカルモデル」には非常に可能性があって、それこそエッジデバイスなどあらゆる端末と対話できる未来が訪れそうです。例えば家電製品でも、今はしゃべることはできてもあまり賢くないという状況です。これが本当に賢くなってくると、調理家電にメニューやレシピを聞くと、全てそこでできてしまう。そんな世界があと数年で来ると思っています。

小澤: 実のところ、技術的なハードルは結構高いと思っています。自動販売機の例で言えば、例えば韓国アイドルが好きそうな方に「韓国アイドルのあの子が、この商品を飲んでいたよ」とお薦めできる自販機は、あらかじめ韓国アイドルの最新情報を知っておかなくちゃダメなわけです。

 家電製品では、取扱説明書の内容だけでなく、暗黙知的な使い方も学習させないと、使い物にならない。こうした知識を、いかにしてAIに入れていくのか。今後の課題になってくるような気がします。

森下: 現状のモデルでは、まだローカルのハードウェアで動かせないので、SLMがもっと小さくなる必要があります。SLMが小さくなれば、デバイス上で動かせるようになってきます。これは技術的な課題で、おそらく近いうちに解消してくれるとは思いますね。

小澤: 別の文脈になりますが、音声AIの活用方法は多岐にわたるので、もしかしたら今後は規制が必要になってくるかもしれません。

森下: どんな技術であっても、悪用者とのイタチごっこは起こりうる問題です。AI活用に関して後れを取ることは、国際競争の観点から見ると致命的だと考えています。変に規制するよりも、なるべく前に進めていくことが重要かと思います。

「高品質ハード×IP×おもてなし」の融合に勝機アリ

森下: 現在、音声AIの主なユースケースはコールセンターです。ここは市場として大きく、かつ人材不足という課題が深刻な業界なので、AIが入ってくることは間違いありません。

 当社の顧客である葬儀社が抱えている課題も、かなり特徴的です。一般的に葬儀社は、24時間いつでも対応する必要があります。ただ、事業規模があまり大きくない企業が多いので、24時間対応するのがとても難しい。顧客対応が上手なスタッフが応対しないと、仕事を受注できないのが現実のようです。現在は、AIによる受電や受電後の業務プロセスを自動化し、人の負担を軽減しています。

Verbexの提供資料

森下: 今後も伸ばしていきたいのは、やはり感情表現面ですね。現在でも十分に感情を汲み取れる技術はあるのですが、葬儀社の事業特性上、お客さまに寄り添った感情表現が必要ですからね。

小澤: 技術面では、モデルのサイズを小さくしていくことに加えて、人間とAIのコミュニケーションや相互作用を研究する「ヒューマン・エージェント・インタラクション」という分野の研究も進んでいます。声色なども含めたキャラクター設計や、どんなインタラクションや反応をするのかという点について、今までの当たり前を疑う必要があります。例えば、会話のスピードに関してですね。前提条件や話を分かっている人は、ゆっくり話されると不快に思う方もいます。その一方で、速い会話スピードについていけない人もいますよね。

森下: コールセンターでは高齢者からの電話も多いのですが、実際に会話の速度に関するニーズがあると聞きます。相手に合わせて自分の会話のスピードを変えるのは、人間のオペレーターでも意外に難しいのです。大抵は、いつもの自分のペースで話してしまいます。一方でAIは、相手のペースに合わせて自動的に調整できます。当社も、そうした機能を開発しており、今年中にはリリースできると思います。

小澤: 対話や会話が得意な人の会話ノウハウをしっかり研究すると面白いかもしれませんね。実際会話のペースってかなり難しい話ですよね。必ずしも相手のペースに合わせればいいわけでもないように思います。例えば、相手の理解度に応じて会話のペースや内容を調整するようなことをしている人もいるわけです。人間はそういった状況だと会話の最中にチューニングしていくことになりますが、音声AIであればスマートフォンの中に蓄積されたデータを活用することで調整できるかもしれません。

森下: 理解度や内容に応じて大事なポイントはちょっとゆっくり話すといった細かい部分の調整が必要となると、現状ではAIがその判断をするためのロジックがまだない状態なので、今後の課題になりますね。

関連記事

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia ビジネスオンライン通信」の登録が必要です