制裁対象の中国AI企業SenseTime、スピード重視の画像モデルをリリース

Wired / 2026/4/30

📰 ニュースIndustry & Market MovesModels & Research

要点

  • 制裁対象となっている中国のAI企業SenseTimeは、新しいオープンソースの画像モデル「SenseNova U1」を発表しました。
  • 同社は、このモデルが米国の競合が開発した上位モデルよりも「画像を生成する」だけでなく「画像を解釈する」面でも大幅に高速だと主張しています。
  • SenseNova U1は、同社がこれまでの勢いを失った状況から立て直し、競争力を取り戻すための切り札になり得るとされています。
  • 顔認識で知られるSenseTimeにとって、画像生成・理解の両機能を強調するモデル公開は、技術的な拡張として位置付けられています。
Save Storyこのストーリーを保存
Save Storyこのストーリーを保存

センスタイム(SenseTime)は中国の AI企業で、顔認識技術で特に知られています。同社は火曜日、新たなオープンソースのモデルを公開しました。同社の主張によれば、このモデルは米国の競合が開発したトップモデルよりもはるかに速く画像を生成し、さらに解釈することができます。SenseNova U1は、中国のAI開発競争で主導的なプレイヤーの一角にいたころから後退した同社が、失った地位を取り戻すのに役立つ可能性があります。

このモデルの「秘訣」は、画像を先にテキストへ変換することなく「読み取れる」能力にあります。そのため処理が速くなり、必要となる計算処理能力の量も減ります。「モデルの推論プロセス全体が、もはやテキストに限定されません。画像でも推論できます」と、センスタイムの共同創業者で最高科学責任者(chief scientist)であるダファ・リン(Dahua Lin)氏は、WIREDとのインタビューで語りました。

リン氏は、香港の中国大学(Chinese University of Hong Kong)で情報工学の教授でもあります。画像を直接処理できるモデルが今後、ロボットが物理世界をよりよく理解できるようにする、と同氏は述べています。

DeepSeekの最新のフラッグシップモデルと同様に、センスタイムはU1が中国製のチップで動かせるとしています。「中国国内の複数の半導体メーカーが、新しいモデルとの互換性を最適化し終えました」とリン氏は語ります。公開当日には、カムブリコン(Cambricon)やバイレン・テクノロジー(Biren Technology)を含む10人の中国のチップ設計者が、同社のハードウェアがU1をサポートしていると発表しました。

この柔軟性は重要です。なぜなら米国の輸出管理によって、中国企業が世界で最も先進的なAIチップ、とりわけ学習用途で使われるチップにアクセスすることが制限されているからです。現時点でこれらは、主にナビダ(Nvidia)のような西側企業によって開発されています。「より多様なチップで学習を進めるよう、引き続き働きかけます」とリン氏は述べています。とはいえ同氏は、センスタイムが「反復のスピードを確保するために、やはり最良のチップを使う必要があるかもしれない」ことも認めています。

センスタイムはU1をHugging FaceとGitHubで無料公開しました。これは、中国の企業がオープンソースAIへの主要な貢献者になりつつあることを示すもう一つの兆しでもあります。

センスタイムは2014年に設立され、コンピュータビジョンで世界的なリーダーになりました。コンピュータビジョンは、顔認識や自動運転といった用途で使われています。しかし、チャットGPTや自然言語処理(NLP)を基盤とする他のAIシステムがテクノロジー業界で最も熱い話題になったとき、センスタイムは収益を上げるのが難しくなり、DeepSeekやMiniMaxのような新興の中国企業に後れを取ることになりました。

センスタイムは、誰でも利用できる形でSenseNova-U1を公開することが、国内のAIプレイヤーと西側のAIプレイヤーの双方に追いつくのに役立つことを期待していると述べています。リン氏によれば、同社はついに昨年、研究者から得られる有益なフィードバックを理由に、オープンソースに注力する決定を下しました。これにより、同社はより速く反復を行えるようになります。「この時代において、オープンソースかクローズドソースかが勝敗の決め手ではありません。重要なのは反復の速さです」とリン氏は説明します。

オープンソースにすることは、地政学による干渉を受けることなく、センスタイムが国際的な研究者との協業を継続するうえでも役立ちます。同社は近年、米国政府から、同社の顔認識技術が、中国の新疆(Xinjiang)地域でウイグル人やその他の少数民族グループを監視し拘束するために使われる監視システムの稼働を支える力になった、という申し立てを理由に、何度も制裁を科されています。その結果、米国企業は、許可証(ライセンス)なしにはセンスタイムへの投資や、同社への特定の技術の販売が制限されています。(センスタイムは申し立てを否定しています。)

画像には、Mike He Yan Kuan、テキスト、スコアボード、成人、人物、頭部が含まれている可能性があります

SenseNova U1を使って作成したサンプル画像。AIで生成

SenseTime提供

はっきり見える

付随する技術レポートの中で、SenseTimeはSenseNova-U1が、現在市場に出回っている他のあらゆるオープンソースモデルよりも高品質な画像を生成すると主張しています。その性能は、AlibabaのQwenやByteDanceのSeedreamのような主要な中国のクローズドソースモデルに匹敵するものの、ほんの一週間前に登場したGPT-Image-2.0のような業界リーダーにはまだ及ばないとしています。

しかし、このモデルの最大の売りは、それらのモデルよりもはるかに速く画像を生成できる能力です。SenseTimeは今年の初めに、NEO-Unifyと呼ばれる革新的な技術構造を予告していました。

効率と性能を高められる可能性がある新しいアーキテクチャこそが、U1を他と差別化している点だと、Hugging FaceのAI研究者Adina Yakefuは言います。「これは、まだ大きな実務上の課題に直面しているという意味で、より野心的なアプローチです」と彼女は述べます。「彼らがオープンソースとして公開することを決めたのは良いことです。そうすればコミュニティが、より広く探索し、検証できるからです。」また、このモデルはPCやスマホでも動かせるほど小さいため、多くのシーンで役立つ可能性があります。

Linは、SenseTimeが開発したこの手法は特にロボティクスで有用になるだろうと語ります。ロボットが視覚的な世界を処理しようとすると、膨大な量の情報を整理しなければなりません。「部屋の中にある散らかったものを、どう扱えばいいんだろう? もし自分の目の前に複雑な機械があったら、どのボタンを押せばいいんだろう?」——これらはすべて一種の情報であり、それらをロボットの内部判断に統合する必要があります」と彼は言います。画像をネイティブに理解できるため、LinはSenseTimeの技術が複雑な環境でロボットの動きをより速くし、ミスを減らすのに役立つと期待しています。

中国は人型ロボットのブームの真っただ中です。SenseTimeは現時点では自社でロボットを開発していませんが、Linによれば、同社は別のSenseTime共同創業者が率いるスタートアップのACE Roboticsと密接に連携しているとのことです。また、地理空間の理解に特化したモデルや、現実世界のシミュレーションを作る取り組みも進めています。