Gemini がロボットを動かす!フィジカル AI 最前線

note / 3/31/2026

💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • Geminiの活用が「フィジカルAI(ロボットの行動)」領域でどのように現実の動作につながるかを、最前線の観点から整理している。
  • ロボットが言語/推論だけでなく、現場での判断や制御にAIを組み込む流れ(人の意図→ロボットの実行)の重要性が示されている。
  • フィジカルAIの実現には、モデル能力に加えてセンサー・ロボット制御・統合設計など周辺要素の整備が鍵になる点が示唆される。
  • 今後のロボット普及に向けて、AIが「机上」から「現場」で価値を出す段階に移っていることが論点となっている。
見出し画像

Gemini がロボットを動かす!フィジカル AI 最前線

215
Gemini - Google の AI

こんにちは、Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。

コンビニで買い物中、お目当ての商品の棚がぽっかり空いていてガッカリした経験はありませんか?
お店のスタッフさんにとっても、レジ打ちや接客の合間を縫って品出しをするのは想像以上の重労働です。実は店舗作業全体の半分近くを、この品出しが占めることもあるそうです。

もし、AI が商品棚を見つめ、足りないものに気づいて自ら商品を補充してくれたら。

スペインで開催された MWC Barcelona 2026 の会場で、KDDI と Google Cloud がお披露目したロボット棚補充のデモンストレーションは、そんな未来を現実にするものでした。

今回は、KDDI の三功浩嗣さんと KDDI テクノロジーの額邦行さんに伺ったお話を交えながら、AI がチャット画面を飛び出して現実世界で手を動かし始める、そのワクワクする裏側をご紹介します。


チャット画面を飛び出して、ロボットが商品を並べる?

KDDI と連携した Physical AI ロボットのデモ

展示会場でひときわ人だかりを作っていたのは、ロボットアームが自ら考えて動く光景でした。

スタッフが「黄色のチョコレートを補充してほしい」とマイクに向かって話しかけます。するとロボットアームがスーッと動き出し、該当する商品を掴んで棚の空いている場所に並べていくのです。

このデモが生まれた背景には、日本の小売業界が直面する人手不足という切実な課題があります。

三功さんは「人の仕事を奪うのではなく、人がやっていて大変な部分をロボットがサポートする。空いた時間で、接客など人にしかできない仕事に集中してもらいたい」と語ります。

これまでのロボットは、決められた場所にあるものを決められた手順で動かすのが得意でした。しかし今回のデモでは、Gemini がカメラ越しに今そこにある現実の空間を理解し、臨機応変に動きます。

新しい商品が入ってきたり配置が変わったりしても、AI 自身が考えて対応できる。頻繁に商品が入れ替わるコンビニのような現場にとって、これはとても心強い進化です。

「黄色いチョコお願い!」の裏側で起きていること

このスムーズな動きの裏側では、いくつもの AI がチームを組んで働いています。
言葉にすると少し難しく聞こえるかもしれませんが、仕組みは驚くほどシンプルで鮮やか。全体像を一枚の図にまとめました。

始まりは自然な会話です。
Gemini Live が耳となり、スタッフの言葉を人間と話すようなスピードで受け取ります。

指示を受け取った AI は「司令塔」として作戦を立て、裏側で待機している別の AI たちに声をかけて商品の在庫や棚の空き状況を瞬時に確認。ここで AI の「目」となる Gemini Robotics ER がカメラ映像を分析し、状況を正確に把握します。

作戦が決まれば、現場の店舗 PC とロボットアームへ指令を届けるだけです。

「まずは認識のところから始めて、ゆくゆくはロボットの動き自体にも適用していきたい」と三功さん。商品の位置が少しズレていても、カメラで追いかけながら正確にピッキングできるような柔軟な制御を目指しているそうです。額さんも「来年、再来年の進化がすごく楽しみです」と期待を寄せていました。

動きの「速さ」とデータの「安心」を両立するハイブリッド構成

頭脳がどんなに賢くても、現実のロボットを滑らかに動かすには別の壁が存在します。

ロボットの関節を 1 秒間に何十回も細かくコントロールするには、通信のわずかなタイムラグも許されません。
そこで今回のシステムは、タスクに合わせてクラウドとローカルを使い分けるハイブリッド構成を採用しています。

「欠品検知自体は遅延に影響されないのでクラウドを使いましたが、ロボットの制御はすべてローカルで処理しています」と額さん。ちなみに欠品検知とは、棚の画像を AI が解析して商品の売れ行きや欠品状況をリアルタイムに把握する仕組みのこと。KDDI ではすでにこの技術の実用化に向けた取り組みを進めています。タスクに応じて両方の良さを見極めるのがポイントだといいます。

もうひとつ重要なのがデータの扱いです。

お店のカメラ映像には、お客様の顔などの大切なデータも含まれます。そのため、すべてのデータを外部に出すのではなく、自社のデータセンター内に Google Cloud を構築できる Google Distributed Cloud (GDC) という安全な環境を整備してデータの機密性を担保します。

三功さんはこれを「ローカルが持つ低遅延と、パブリック クラウドほどデータが外に流れない安心感。そのちょうどいいところにある」と表現していました。これなら、プライバシーへの配慮が欠かせない現場でも安心して導入できますね。

うれしいことに、このシステムは特定のメーカーのロボットに縛られず、オープンに適用できる方針で開発されています。実機を買わなくても、物理世界をシミュレーションするツールを使って、まずはパソコンの中で動きを試すこともできるそうです。

コンビニから広がる、あらゆる手作業のアップデート

KDDI グループのローソンとの実証実験から生まれたこの取り組みは、安全を最優先に、お客様の妨げにならないスペースでの作業からスタートしています。

重労働をロボットが引き受け、人間は接客やお店づくりといった人にしかできない仕事に集中する。そんな優しい分業の形が、もうすぐそこのコンビニで始まろうとしています。

そしてこのデモが示しているのは、決して小売業界だけの未来ではありません。

MWC の会場では「工場のラインで使えるか」「農業に応用できるか」「薬局はどうか」といった具体的な問い合わせが多く寄せられたといいます。三功さんは「まずはリテールですが、モビリティや介護など、人が今やっているところでロボットが少しでも役に立っていくといいなと思います」と展望を語ります。

現場のリアルな悩みを出発点に、そこから得た知見をどんどん別の業界へと広げていく。ゆくゆくは私たちの家庭まで、AI を搭載したロボットが当たり前のように日常をサポートしてくれる日が来るかもしれません。

デジタルの枠を超えて現実空間でサポートを始めた Gemini が、皆さんのビジネスや生活でどんな新しい日常をつくるのか、今からとても楽しみですね。

関連リンク:KDDIテクノロジー


ダウンロード
copy
215