DeepSeek V4:「ポスト・DeepSeek時代」は到来したのか?

ChinaTalk / 2026/4/27

💬 オピニオンSignals & Early TrendsModels & Research

要点

  • この記事は、DeepSeek V4のリリースがAI業界における「ポスト・DeepSeek」局面の始まりを意味するのかを検討しています。
  • DeepSeek V4を、主要モデル提供企業間の競争を示す重要なサインとして位置づけ、能力向上の速さに対する示唆を論じています。
  • 記事は、V4が今後のベンチマークや開発者の期待、ユースケース全体での普及ペースに関して何を示しているのかを扱います。
  • 次の時期を、「特定の目立つモデル」から「複数の有力陣による広範な勢い」へ市場が移っていく局面として捉えています。

DeepSeek V4

「ポスト・DeepSeek時代」は到来したのか?

2026年4月27日
21
3
3
シェア

ついにDeepSeek V4が登場しました。ProモデルとFlashモデルは、4月23日時点でDeepSeekのWebサイト、モバイルアプリ、そしてAPIアクセスを通じて利用可能になっており、ラボもあわせて技術レポートを公開しています。

中国のAIラボがオープンソースから距離を置くという最近の流れに逆らう形で、V4は非常に許容度の高いMITライセンスの下でリリースされました。各種ベンチマークで見事に高い性能を示し、中国のオープンモデルのトップを引っ張っています。しかし、米国のクローズドモデルとの差を縮めることはできていません。しかも論文内で、著者自身がV4は最先端のフロンティアモデルに対し「3〜6か月遅れている」と認めています(ただし、我々の感覚ではそれ以上の遅れに感じます)。そして後述するように、そのアーキテクチャは中国のスタックを自国化していく方向への進歩を示している一方で、このモデルはおそらく依然としてNvidiaのGPUに依存していたでしょう。

V4は失望作なのでしょうか?今日のChinaTalkでは、中国のオブザーバーたちの見解とともに、私たちの見立てをお届けします:

  • V4登場前にラボで起きていたトラブル;

  • なぜDeepSeekの理想主義は維持されないかもしれないのか;

  • V4が国内のハードウェアで達成したこと、そして達成できなかったことは何か;

  • なぜDeepSeekの象徴性が、中国ではフロンティアを失った後もなお残り続けるのか

翻訳はClaude Opus 4.7の支援を受けて作成し、その後正確さと自然さのために編集しました。太字のマークは編集者によって追加されています。

V4はどのようにしてここまで来たのか

中国のテックジャーナリストたちは、DeepSeekの物語を執念深く追ってきました。北京を拠点とする著名なテックニュース媒体である36Krの周鑫雨(Zhou Xinyu)が、舞台裏のスクープをいくつか明かしています。

[V4の]到着が遅れた理由は、NVIDIAからHuawei Ascendへ学習基盤を移行したことに加えて、DeepSeek内部での意思決定の変更にも関係しています。私たちは2025年中盤にDeepSeekが、比較的深刻な学習失敗のケースに遭遇したことを知りました。

返却形式: {"translated": "翻訳されたHTML"}

「当時、DeepSeekはチップに再適応するという問題に直面していました」とある関係者は述べた。「社内では、学習の方向性についての見解が完全に一致していたわけではありません。梁文峰(Liang Wenfeng)はいくつか独自の要求を出しましたが、実行レベルで折り合いをつけるのは難しかったのです。」

しかし、新しいモデルがマルチモーダルな生成や理解をサポートするのではないかという外部の憶測とは裏腹に、V4は言語モデルのままです。 マルチモーダル生成の学習を延期する決定は、主に計算能力と現金に関する制約に起因しています。

複数の関係者が AI Emergence [AIに注力する36Krのサブブランド] に対し、DeepSeekの外部資金調達の窓口が2026年4月中旬に開いたと伝えています。社内の引き金は、より大きなパラメータ規模のモデルを学習するために資金がさらに必要だったこと、そして同時に、より多くの一流人材を維持し、採用し続ける必要があったことです。

上海のニュースサイト The Paper 澎湃新闻の范佳来(Fan Jialai)は、DeepSeekの人材流出について包括的な まとめを作成しました。Tencent、ByteDance、Xiaomi、そしてDeepRoute.aiへの流出により、中核となる貢献者を失いました。 「複数の領域――基盤となる大規模言語モデル(LLM)、エージェント、テキスト認識(OCR)、マルチモダリティなど――にわたって、DeepSeekは中核人材の損失を被っています。」

DeepSeekはフロンティア・ラボの理念で運営されています。2024年11月に、私たちは中国メディア局Wave 暗涌の于丽丽(Lili Yu)によって行われた、DeepSeekのCEO梁文峰氏に関する インタビューを翻訳しました。そこでは、梁氏がプロダクト開発には関心がなく、目標は常に「AGI」だと説明していました。だからこそ、Llamaアーキテクチャを採用するのではなく、R1の背後にある新しいモデル・アーキテクチャにリソースを注ぎ込んだのです。なぜ研究であってプロダクトではないのか、彼らの raison d’êtreについて、梁氏は次のように述べました:

長年、中国企業は他の誰かが技術のイノベーションを行うものだと思ってきました。一方で私たちはアプリケーションの収益化に注力していました――しかし、それは必然ではありません。…

私たちは、経済が発展するにつれて、中国は次第にフリーライダーではなく貢献者になっていくべきだと考えています。 過去30年以上にわたるITの波の中で、私たちは実際の技術的イノベーションにはほとんど参加していませんでした。私たちはムーアの法則が空から降ってくるものだと慣らされ、家にいて18か月後に、より良いハードウェアとソフトウェアが現れるのを待つ――それがスケーリング・ロー(Scaling Law)が扱われ方だと思ってしまっているのです。

しかし実際には、それは西洋主導の技術コミュニティの世代が、たゆまぬ努力によって生み出してきたものです。ただ、私たちがこれまでそのプロセスに関わっていなかったので、その存在を見過ごしてきただけなのです。

この意味で、最も近い米国の例に当てはめるなら、ChatGPT以前のマイクロソフト時代のOpenAIかもしれません。つまり、ミッション主導で、十分に資金があり、AIフロンティアを非営利で発展させることにコミットしている存在です。最初期のOpenAIを突き動かしていた原動力が安全な超知能(safe superintelligence)だったとすれば、DeepSeekの原動力はAGIへの野心、オープンソースへの理想主義、そして国家としての誇りの組み合わせでした。

最新の意味では、それは成功しました。DeepSeekは中国のLLM分野における全国的なチャンピオンになったのです。しかし、その呼称、そして創業者の高邁な構想が、研究の潜在力を鈍らせてしまいました。梁氏は、Sam AltmanがChatGPTでやったように、2025年の早い時期にDeepSeekの波に乗って、規模の大きいコンシューマ向けプロダクトを作ろうとはしませんでした。代わりに、チームのエネルギーを、梁氏が名を知られるようになった「徹底的なハードコア研究」にだけ専念させたのです。過去12か月にわたって収益を生む事業を構築しなかったこと、あるいは中国のハイパースケーラーと提携しなかったことで、梁氏は人材を流出させ、国内の競合に対して持っていたリードを失ってしまいました。

ほかのどのラボよりも、DeepSeekは、海外で密輸されたチップやNvidiaのクラウド計算に頼るのではなく、中国製チップの実証(PoC)を生み出すという期待を背負っていました。その代償として、財務的な稼働期間と人材を失い、おそらく失敗した学習ランがV4のリリースを数か月遅らせる要因にもなりました。先述の36Krの話では、この1年の間にDeepSeekのリクルーターが、マーケティング部門を新設するために人材となり得る中国の専攻学生を探して、北京大学の寮をうろついているのを見かけたと報じられています。

2025年1月20日、梁文峰が李強首相との会合に出席している。 出典

2025年にR1が登場した後、Interconnectedのジョーダンとケヴィン・シューは、ポッドキャストのエピソードの中で、近い将来DeepSeekが、ハイパースケーラーとの取り引き、あるいは別の潤沢な資金を持つ主体によって引き込まれる可能性があると推測していた。彼らの見立ては当たっていた。36Krによれば:

オープンな資金調達へと方針転換するための外部要因について、複数の業界関係者は、それはある特定の大手企業の投資姿勢に関係しているのではないか、と推測している。DeepSeekを資金調達のために開く前に、梁文峰とその企業のトップリーダーは独占投資に関する協議を何度か行っていた。しかし、この件に関連する2つの情報源によれば、梁文峰は、そのリーダーが提示した20%持分を譲渡するという条件に同意しなかったという。

V4が今出たことで、DeepSeekは三つの使命の核心に切り込むジレンマの渦中にある。OpenAIが消費者向けおよび企業向け製品を大規模にマーケティングしたことで、営利企業への移行は円滑に進んだ。一方でDeepSeekは、中国国内における市場開発の黄金期を逃した。V3とV4の間で、ByteDanceのDoubaoは中国で最もダウンロードされたチャットボットになり、アリババのヘルスアプリ「Afu」のような特化型AIプロダクトが画期的な成功を収めた。またMiniMaxと Z.aiという、純粋なモデル開発企業2社は上場し、国際市場に打って出た。言うまでもなくDeepSeekは、中国市場の資本制約のもとで「収益」が重要であることを認識するのが遅かった。

私たちがDeepSeekに「黒字化への道」が欠けていること、そしてそれが背負い始めた途方もない政治的な圧力を検討した際、研究所の悲劇は 予告されていたのかもしれないと思った。そこから時間が進み、いま36Krのストーリーは「DeepSeek後の時代」を打ち出したばかりだ。Qwenの従業員は36Krに対し、「非営利AI開発の黄金時代は終わった」と語った。しかしこの記事は同時に、DeepSeekがわずか1年で中国のAIの風景を形作ったことも認めている。モデルアーキテクチャの革新やオープンソースの理念に加え、フラットな社内階層、新興人材への重点、そしてAGIを志向するオープンな研究文化が、DeepSeekの成功を再現しようとする他の研究機関のマネジメント判断にも影響を与えている。

米国式の訓練、 中国式の推論?

V4は最終的に、依然としてNvidiaのチップで訓練された。しかし4月24日、Huaweiは、自社のAscendスーパー ノード・クラスターがV4をサポートできることを確認した。今月初め、DeepSeek はNvidiaとAMDにV4の早期アクセスを提供しなかった。これは、おそらく表面的には、欧米のチップメーカーから距離を置いていることを示唆しているのかもしれない。有名なテックブロガーのDigital Life Kha’Zix 数字生命卡兹克 V4の技術レポートを検討し、モデルが中国製のハードウェア向けに最適化された方法に関する4つの観察をまとめて返ってきた。

  1. V4は、ポストトレーニングおよび推論システムにMXFP4を導入した。

訓練は依然としてNVIDIAのエコシステムを使用しているが、ポストトレーニングと推論でMXFP4を使うことは、実質的にDeepSeekがオープンな低精度フォーマットや複数のハードウェアへの適応へ向かっていることを意味する。Huawei Ascend、Cambricon、Birenなどの国内チップに適応できるようになり、特に推論時においてNVIDIAのFP8エコシステムへの依存を減らすことができる。つまりそれは、国内のエコシステム上で動作する、真の国内生産モデルになるはずだ。…

  1. V4の基盤となるカーネルは、もはやCUDAで全面的に書かれているわけではなく、代わりにTileLangというドメイン固有言語(DSL)で書かれている。DeepSeekは、低レベルのオペレータ開発がCUDAに完全に閉じ込められるのではなく、より高レベルの言語を使って計算を記述し、その後できる限り異なるハードウェア向けにコンパイルすることを望んでいる。これは本当に見事で、移植コストを大幅に削減できる。

  2. V4は、専門家並列(expert parallelism)における通信待ちを減らすために、MegaMoEという融合カーネルを特別に開発した。これはすでにHuawei Ascend上で正常に実行されている。

この3つのポイントをまとめると、方向性ははっきりしている。V4は上から下まで、国内チップ向けに設計されたモデルだ。

これは本当に、ある種の愛国的な物語ではない。誰もが、将来どれほど計算能力が希少になるか、計算能力の生産がどれほど遅いか、そして—Agentsの加速によって—トークン消費がどれほど恐ろしいものになるかを知っている。

計算能力が締め付けられる中で、誰も良い選択肢を持てない。GLM-5.1のような優れたモデルでさえ、推論計算によってどれほど制限されているかを見ればよい。

計算能力をめぐるゲームは、多くの点で最上位の地政学のゲームだ。

DeepSeek V4は、この計算能力をめぐる争いによって強いられて現実になったものだ。

DeepSeekがV4モデルを公式発表した際には、興味深い注釈が付いていた:

高性能計算リソースの制約により、現在V4-Proのサービススループットは制限されている。今年後半にHuaweiのAscend 950スーパー ノードが量産出荷され次第、Proの価格は大幅に下がる見込みだ。

この計算の物語は、おそらく、中国のDeepSeekのようなモデルが西側の競合に対して、さらにさらに遅れを取っていくことを示しているのでしょう。西側のモデルは、ますますBlackwellで学習・実行されるようになっており、やがてRubinに移行します。RubinはFP4の数値精度をサポートでき、事実上、FP/INT8までしか対応していなかったそれまでの世代の計算量を実質的に2倍にできます。DeepSeekは古いHopperを使い続けて行き詇まっており、それらはINT8までしか対応していません。追いつくチャンスがあるとすれば、HuaweiのAscend 950(FP4をサポート)を十分な数だけ生産してもらえるよう祈るしかないでしょう。 Reutersによれば、Huaweiは今年、Ascend 950PRを75万台出荷する計画です。参考までに、これは アメリカの高品質調整済み半導体生産の1週間に相当します。

“The People Long for DeepSeek”

2025年に「DeepSeekの瞬間」が到来したとき、それは中国にとっての土着の技術力を示しただけではありませんでした。開発者の一部や一般の人々にとっては、初めて、最先端のAIに本当に手が届く価格でアクセスできることも意味していました。アメリカの最前線ラボは、これまで常に中国本土でのチャットやAPIアクセスを制限してきましたが、多くの中国の利用者はとにかくファイアウォールの回避方法を見つけていました。それでもDeepSeekは、手間なく使えるモデルであり、そしてごく短期間ながら、ほぼ同等の性能を提供してくれたのです。

しかし1年が経った今、中国のユーザーが選べる国内モデルは、現実の多くのアプリケーションに組み込まれたうえで、はるかに増えています。一方でOpenAIとAnthropicは、リードを固めたように見えます。需要は高まり続け、財務上の損失も積み重なる中で、AI企業にできることは、より多くのコストを支払う顧客に転嫁する以外にありません。最先端モデルを大々的に活用できる人は、ますます減っていきます。今年前半の中国のOpenClawブームは、人々にAIの本当のコストをまざまざと示しました。自家製のエージェントがトークンをがぶ飲みし、結果として高額な請求書を突きつけられたからです。

「ロブスターを育てる」のがどれほど高くつくかを描いたミーム。 出典

2017年、ブロガーの方浩(Fang Hao)が、 「人々は周鴻祎を望む」 というタイトルのバズ記事を公開しました。周はセキュリティソフトウェア企業Qihoo 360の創業者で、中国のテック業界では有名な喧嘩腰の人物です。アリババとテンセントがECとソーシャルメディアにおける独占的な地位を固めていた時期に書かれた文章で、方は不敬なユーモアで悲観的な将来予測を語りました。中国のビッグテックがプライベートセクターの機会を無差別に食い尽くしていけば、平均的な消費者はより不利になる——と。

先月、テンセントのテック系メディアブログの蘇揚(Su Yang) が続編を書きました:「人々はDeepSeekを望む」。彼はジェンセン・フアンの「トークノミクス」的なレトリックに反論しています:

トークンの利用コストが下げられず、かつ投資対効果(ROI)の実効的なリターンがはっきりしないとき、トークン消費を攻めた形で推し進める——しかもそれを業績評価と結びつける——のは、トークンに対する不安を“でっち上げて”作っていることに等しい。「トークン不安の製造」と呼ぶことも、大げさではありません。

もう少しさかのぼれば、ジェンセン・フアンは、テック業界のリーダーに対して、慎重に発言し、AI技術に対する非合理な大衆の恐怖を煽らないよう求めてもいました。要するに業界全体にこう伝えているのです——パニックを“作って”AIを抑え込むのはやめろ。皆、トークンを燃やし続けないといけない。

しかし問題は、 誰が価格の問題を解決するのか? 長らく待たれているDeepSeek V4がそれを担うのでしょうか?

蘇はこの価格の問題を 続きの投稿 で掘り下げています。最終的には、中国のAI業界における競争的なイノベーションの未来に楽観的だとしつつも、DeepSeekはもはや“唯一の旗手”ではなくなるだろうと考えています:

大づかみに言えば、2025年には中国のオープンソース勢力が世界のAIの地図を作り替えました。2026年には、中国のAI開発は、能力を輸出する段階に入りました。

世界のAI業界の観点から見ると、技術的な道筋の多様化は人材の流動性を活性化させ、サプライチェーンのレジリエンスを強めました。下流のアプリケーション開発者にとっては、複数のサプライヤーから選べることが、交渉力の向上とロックイン(囲い込み)リスクの低減につながります。

中国のAI物語でさらに心強いのは、市場がまだ一握りの寡占によって独占されていないことです——競争的なイノベーションや人材エコシステムの構築にとってプラスの兆しであり、米中のAI競争においてはクラスター(地域・集積)レベルの優位性を築く助けにもなっています。

フルエコシステムの競争という状況の中で、DeepSeek——その原理が力の源となっており、基盤層でのブレークスルーによって推進力を生み出している——は依然として強みを持っていますが、 弱点も同様に明確です。IT大手のような産業エコシステムの支えが欠けており、製品のアプリケーション機能も比較的薄く、多モーダルおよびエージェントのエコシステムもまだ強化が必要です。

コーディングは前進の道か?

V4のコーディング能力は大きく伸びており、Claude Codeのような製品が成功した後に、DeepSeekもコーディング・エージェントに可能性を見ていることを示唆しているかもしれません。プログラミング系ブロガーのLarge Model Observer(大模型観測員) V4をソフトウェア工学プロジェクトで 検証 し、2つの長所と2つの短所を見つけました:

第一に、幅広いプログラミング知識。4つのエンジニアリング案件[著者がV4でテストしたもの] にまたがって、ニッチな領域知識が豊富であることが不可欠です。そうでないと、たとえばmacOSアプリがウィンドウを適切に表示できないといった、単純なバグすら修正できない事態になり得ます。ストーリーボードが正しく設定されていなかったためです。V4の知識ベースは、こうしたあまり主流ではない領域も実質的にカバーしています。そして、さまざまなイレギュラー(エッジケース)に直面した際、V4 Proは推測で済ませるのではなく、バグの根本原因を直接特定できます。GPTやOpusと同じように。…

また、V4 FlashもProにそれほど遅れておらず、幅広い知識の面では大差ありません。Flashが主に不足しがちなのはエッジケースの知識で、分かりにくいバグに対しては行き詰まりやすい傾向があります。

第二に、長いコンテキストにおける幻覚(ハルシネーション)が少ないこと。工学系のテストでは、特徴がラウンドごとに段階的に積み上げられるモードが使われているため、後半のラウンドでは、グローバルな修正が要求された際に、モデルがプロジェクト全体を読み直して、関連する詳細をすべて見つけ直す必要が生じることが多いのです。GPT/Opusのようなものには問題になりませんが、中国の国内モデルにとっては現実的なハードルです。V4 ProとFlashは、高位および最大ティアでは実質的に幻覚レベルをかなり低く保てており、長いコードベースに対する下流のフローでのバグ率も低いままに抑えられます。

第三に、ときどき注意が途切れること。案件が大きく、要件も多いとき、高位ティアのV4 Pro(思考予算の配分制約のため)は、実装上の特定の詳細をランダムに落としてしまう確率がある程度あります。幸いなのは、リマインドと1〜2ラウンドの自己テストで、ほぼ確実に問題を修正できる点です。…

第四に、建築(アーキテクチャ)やUIに対する、こだわりの薄さ。V4は主に、DeepSeek V3のアーキテクチャ設計に関する思考を引き継いでいます——特に趣味が良いわけでも洗練されてもいませんが、雑に投げやりというわけでもない:そこにあるべきレイヤリングやデカップリングは、きちんとそこにあります。Opusのように、一目で分かるような磨き込まれた、明確に“職人が作り込んだ”アーキテクチャを提供できるわけではありません。UIも同様です。直接の出力は突出して良いわけではなく、たまに洗練された表現が入ることはあるものの、ほとんどの場合は基本的に使えるレベルにとどまります。高位ティアでは、さらに下振れ(床)が低くなることもあり、配慮が足りないことがあります。開発ワークフローに従うべきデザイン仕様書が含まれているなら、大きな問題にはなりません。しかし “雰囲気でコードを書く”(vibe coding)だけの場合、満足できる結果を得るにはかなりのやり直し(rerolling)が必要になります。

V4は、LLMに対してV1やR1がやったように、AIコーディングの最前線へのアクセスを民主化できるのでしょうか。特に中国のユーザー層にとって? それは不可能ではありませんが、モデルはオープンソース勢の間で十分な競争に直面しています。主要な中国のオープンモデルのトークン価格を、RMBでざっと比較すると:

DeepSeekの価格は競争力があり、目立つほどの決定的な優位とは言えないとしても、十分に戦えます。BusinessAlert 知危 次のように要約しています:

今では、ユーザーはもはや「思考の連鎖(chain-of-thought)」に感心しなくなっています。せいぜい、それは、より多くの計算資源を問題に投入して正確性を高めるエンジニアリング手法であり、コード作成エージェントのようなシナリオでは、おそらく大半の時間は無視されているでしょう。

[V4]の能力の上限を考えると、それが現実のプログラミング課題で主導的な役割を担う可能性は低く、実行(executor)としては遅すぎます。……結局のところ、私たちがテストしたケースの観点では、DeepSeek V4のパフォーマンスは期待ほど良くなく、能力についても特に安定しているようには見えませんでした。とはいえ、公式の技術レポート自身が率直に述べているとおり、依然としてそれとトップのクローズドソース・モデルとの間にはギャップがあり、このアップデートはそのギャップを「縮めるだけ」だとしています。つまり、結果は驚くべきものではありません。

それでも、格言どおり「もう一度、価格を見てみてください」。安いのです……これなら我慢できます。

中国のオープンモデルによる価格競争は、一見すると熾烈に見えますが、そこには根本的な課題が隠れています。ビジネスモデルがまだ明確ではなく、さらにエコシステム全体が、より深刻なレベルで資金不足に陥っています。ニックとジョーダンが最近行った 分析——なぜ中国の一部のラボがクローズドソース化しているのか、そしてなぜDeepSeekは中核となる政治的な方程式を変えないのか——を、ここで紹介します:

AIに対する中国の資金調達環境は、アメリカに比べて桁違いに小さいのです。Masayoshi Sonの2,000万ドルがAlibabaの立ち上げを後押ししたことはあるものの、彼は今やOpenAIに約1,000億ドル近くを投じている一方で、中国のエコシステムには何も投じていません。規模は自体が中国の6倍である西側のVCは、資金をアメリカのラボに注ぐことに徹しています。湾岸(Gulf)の資金はMiniMaxとZhipuに約1億ドル投資し、さらにAnthropicとOpenAIに約150億ドル投資しています。…

では、中国のAIエコシステムがクローズド化した今、北京の政策の観点から何が起きるのでしょうか。おそらく大きなことは起きないでしょう。国が、継続的なオープンソース・モデル開発を補助するのに必要な何十億ドルもの資金を投入する気になるとは、私たちはかなり驚いてしまいます。仮に、驚くようなDeepSeek V4のリリースがあってオープンソースにとって好意的な見出しを生んだとしても、他のラボが直面しているビジネス上の現実を変えることはできません。中国政府は根本的に、ハードウェア寄りの発想に偏っています。そして、たとえ1年先のように劇的なDeepSeek V3でさえ、そのバイアスを揺るがすには至っていません。

DeepSeekは自己詩的に語る

ジョーダン:私はこの記事をDeepSeek V4に渡して、「それがどんな気分にさせたか」を詩として書くよう頼みました。

そして中国のものです:

新しい投稿を受け取り、私たちの活動を応援するために、購読してください!

Subscribe
21
3
3
共有