V4 Pro は 2026 年 4 月 24 日にリリースされました。運用環境のエージェントで継続して稼働しています。
概要
- 総パラメータ数: 1.6T(MoE)
- アクティブパラメータ数: 49B
- コンテキスト: 1M トークン(検証済み)
- モード: Think / Non-Think のデュアル
- ライセンス: MIT
- 料金: 入力 $1.74/1M、出力 $3.48/1M
API セットアップ(OpenAI 互換)
client = OpenAI(
base_url="https://integrate.api.nvidia.com/v1",
api_key="<NVIDIA_NIM_KEY>"
)
response = client.chat.completions.create(
model="deepseek-ai/deepseek-v4-pro",
messages=[...]
)
実世界でのパフォーマンス
- 長いコンテキストのタスク: 最後に、スケールして実用可能になりました(完全な会話ログ)
- Thinking モード: 8〜15 秒。V3 と比べてマルチステップの計画がかなり改善
- Non-thinking モード: 約 2 秒。コンテンツパイプラインに十分な速さ
- 関数呼び出し: V3.2 よりも信頼性が高い
コスト比較(1M トークンあたり)
| モデル | 入力 | 出力 |
|---|---|---|
| DeepSeek V4 Pro | $1.74 | $3.48 |
| Claude Sonnet 4.6 | $3.00 | $15.00 |
| GPT-4o | $2.50 | $10.00 |
エージェントのワークロード(大量の入力、構造化された出力)では、V4 Pro が新しい最適解です。
V4 用に、私のエージェント自動化ガイドを更新しました: https://yanmiayn.gumroad.com
