DeepSeek V4 Proがついに登場——AIエージェントで何が変わった?

Dev.to / 2026/4/25

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • DeepSeek V4 Proは2026年4月24日に提供開始され、1Mトークンの長いコンテキストとMITライセンスを備え、AIエージェント向けの新たな選択肢として打ち出されています。
  • MoE構成(総パラメータ1.6T、アクティブ49B)を採用し、デッパーな多段計画と低遅延な実行を両立するためにThink/Non-Thinkのデュアルモードを用意しています。
  • パフォーマンス面では、Thinkモードがより良いマルチステップ計画を提供(8〜15秒)し、Non-Thinkモードは高速(約2秒)で動作、さらに関数呼び出しはV3.2より信頼性が高いとされています。
  • NVIDIAのベースURLを使ったOpenAI互換APIセットアップが紹介されており、既存のエージェント基盤への統合がしやすい点が強調されています。
  • 1Mトークンあたりの価格がClaude Sonnet 4.6やGPT-4oより大幅に安いと示されており、入力が多く構造化出力が多いエージェント・パイプラインで「最適な選びどころ」になり得ると述べられています。

V4 Pro は 2026 年 4 月 24 日にリリースされました。運用環境のエージェントで継続して稼働しています。

概要

  • 総パラメータ数: 1.6T(MoE)
  • アクティブパラメータ数: 49B
  • コンテキスト: 1M トークン(検証済み)
  • モード: Think / Non-Think のデュアル
  • ライセンス: MIT
  • 料金: 入力 $1.74/1M、出力 $3.48/1M

API セットアップ(OpenAI 互換)

client = OpenAI(
    base_url="https://integrate.api.nvidia.com/v1",
    api_key="<NVIDIA_NIM_KEY>"
)
response = client.chat.completions.create(
    model="deepseek-ai/deepseek-v4-pro",
    messages=[...]
)

実世界でのパフォーマンス

  • 長いコンテキストのタスク: 最後に、スケールして実用可能になりました(完全な会話ログ)
  • Thinking モード: 8〜15 秒。V3 と比べてマルチステップの計画がかなり改善
  • Non-thinking モード: 約 2 秒。コンテンツパイプラインに十分な速さ
  • 関数呼び出し: V3.2 よりも信頼性が高い

コスト比較(1M トークンあたり)

モデル 入力 出力
DeepSeek V4 Pro $1.74 $3.48
Claude Sonnet 4.6 $3.00 $15.00
GPT-4o $2.50 $10.00

エージェントのワークロード(大量の入力、構造化された出力)では、V4 Pro が新しい最適解です。

V4 用に、私のエージェント自動化ガイドを更新しました: https://yanmiayn.gumroad.com