Nvidia、「Nemotron 3 Nano Omni」で最新のマルチモーダルモデルの中身を明かす

THE DECODER / 2026/4/29

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • Nvidiaは、テキスト・画像・動画・音声を扱えるオープンなマルチモーダルモデル「Nemotron 3 Nano Omni」をリリースしました。
  • 今回の発表では高い性能が注目点となっており、マルチモーダル用途における実用的な選択肢として位置づけられています。
  • さらにNvidiaは、学習データの出どころについても透明性を示し、Qwen、GPT-OSS、Kimi、DeepSeek OCRなどを挙げています。
  • ただのベンチマーク結果にとどまらず、現代のマルチモーダルモデルがどのように組み立てられているかを理解する材料になるとして、このリリースが取り上げられています。

Nvidiaは、テキスト、画像、動画、音声のためのオープンなマルチモーダルモデル「Nemotron 3 Nano Omni」をリリースしました。性能の高さもさることながら、学習データにも注目が集まります。学習データは、Qwen、GPT-OSS、Kimi、DeepSeek OCRなどから作られているとのことです。

この記事 Nemotron 3 Nano Omniで、Nvidiaが現代のマルチモーダルモデルに本当に何が投入されているのかを明かす は、The Decoder に最初に掲載されました。