最近NvidiaのGTCカンファレンスに行ってきたのですが、正直なところ、ここしばらく参加した中で最も目を見開かされるようなイベントのひとつでした。掘り下げるべきことはたくさんありましたが、私の最大の収穫(Takeaway)はこれです。世界モデリングは今まさにAIの“GOAT”であり、研究コミュニティ以外の人たちは、これから何が来るのかを十分に理解できていない気がします。
1年前、私がカンファレンス巡りをしていた頃は、世界モデルはまだこのようなニッチで、ほぼ学術的な概念でした。話題にすると、白紙のような表情になったり、丁寧にうなずかれたりするだけでした。では今は?GTCでの真剣な会話は、どれも最終的にそこに戻っていました。認識の移り変わりは劇的です。2021年に、誰もが突然「トランスフォーマーを理解した」あの瞬間に似ている気がします。
馴染みのない人のために説明すると、世界モデルとは「次のトークンを予測するだけ」のAIではありません。世界がどのように成り立っているかの内部表現を構築します。環境をシミュレートしたり、先を見据えて計画を立てたり、因果関係について推論したり、さらに長い時間軸にまたがって動作したりできます。これは、本質的にLLMがやっていることとはまったく別物です。LLMは基本的に、テキストに対する非常に洗練されたパターンマッチングにすぎません。
ジェンセン・フアンはGTCで、次のフロンティアは単に「より大きな言語モデル」ではなく、現実を理解しシミュレートできるAI、つまり世界モデルだと非常に明確に示しました。
とはいえ、ひとつ大きな不満があります。私が見てきた世界モデリングのほぼすべての応用が、ロボティクス(物理的AI、自動運転、ロボットによる操作)にあることです。そこに、すべてのエネルギーが向かっているように見えます。誤解しないでください、今でもワクワクするのですが、非物理領域では計り知れない価値を取りこぼしているような気がしてなりません。
考えてみてください。ビジネスマネジメントへの世界モデルの適用、創薬、金融など、他にもたくさんあります。可能性は非常に大きいのに、ロボティクス以外の領域での研究や商用アプリケーションは、現時点ではまだ十分に育っていないように感じます。
そこで疑問です。ここで面白い取り組みをしているのは、ほかに誰なのでしょうか?世界モデルを非物理領域に押し広げようとしていて、私も注目すべき企業や研究ラボはありますか?下に挙げてください。
[link] [comments]




