Doubao Seed 2.0とは?
Doubao Seed 2.0は、ByteDanceのフロンティア級LLMファミリーで、2026年2月14日にリリースされました。Doubaoのコンシューマーアプリ(MAUで中国最大のAIチャットボット)の基盤となるエンジンです。「Seed」という名称はByteDanceの社内研究ラボを指しており、2.0ファミリーの各バリアントはすべて同一のベースチェックポイントからポストトレーニングされ、その後それぞれに特化されています。
バリアントは4種類あります:
- Seed 2.0 Pro — 主力の推論+マルチモーダル。Claude Opus / GPT-5.2 / Gemini 3 Proと競合
- Seed 2.0 Code — Proと同価格。ソフトウェアエンジニアリングのタスク向けにポストトレーニング
- Seed 2.0 Lite — バランスの取れた汎用型。コストの一部で中位層の米国モデルと競合
- Seed 2.0 Mini — 低価格帯の実務担当。高い同時実行ループ(分類、抽出、軽量エージェント)向けに設計
4種類すべてが256Kトークンのコンテキストウィンドウ(最大32Kの出力トークン)を共有し、4種類すべてがビジョン入力、関数呼び出し、プロンプトキャッシュ、構造化出力をサポートします。ProとCodeはさらに拡張推論(「thinking」モード)に対応し、Proはビデオ入力にも対応しています。
Doubao Seed 2.0の料金 — 実際にあなたが払う金額
国際的な開発者にとって重要なのは、2つの料金体系です。
直接 Volcengine ARK(中国): 中国の電話番号が必要で、住民IDの本人確認(本土ID検証)と、AlipayまたはWeChat PayによるCNYのチャージが必要です。これらのハードルをクリアできるなら最安です。
ofox.ai OpenAI互換ゲートウェイ: USD請求、メール登録、そして中国のID不要。直接ARKに対するゲートウェイ側の適度な上乗せはありますが、同じキーでClaude、GPT、Gemini、DeepSeek、Qwenも利用できます。
以下は、ofox経由で各ティアが実際にいくらかかるか(2026-05-20時点の ofox.ai/llms-full.txt による検証済み)です:
| バリアント | 入力 ($/MTok) | 出力 ($/MTok) | コンテキスト | 最適用途 |
|---|---|---|---|---|
| Seed 2.0 Mini | $0.06 | $0.56 | 256K | 大量の分類、抽出、軽量ルーティング |
| Seed 2.0 Lite | $0.13 | $0.76 | 256K | 汎用チャット、RAG、コンテンツ生成 |
| Seed 2.0 Code | $0.67 | $3.36 | 256K | コード生成、リファクタリング、ファイル編集を伴うエージェントループ |
| Seed 2.0 Pro | $0.67 | $3.36 | 256K | 難しい推論、数学、ビジョン、多段階の計画 |
参考までに、GPT-5.2は$1.75/$14.00 per MTok、Claude Opus 4.6は$5.00/$25.00、Gemini 3.1 Proは$2.00/$12.00です。Doubao Seed 2.0 Proは$0.67/$3.36で、まったく別の価格帯に位置しています。Miniは$0.06/$0.56で、さらに別です。
Pro/Codeの価格同等(トークンあたりの同一価格)は意図的です。ByteDanceはCodeを、コーディングに特化したヘッドを持つProとして扱っています。いずれにせよフラッグシップ料金を支払うので、「必要なポストトレーニングがどちらか」で選んでください。
ベンチマーク — 各バリアントが実際にどれだけ出せるか
ByteDanceのリリース資料および第三者評価(apiyi.com, datalearner.com, evolink.ai)から得られる公開ベンチマークスコアを、2026-05-20時点の情報と突き合わせています:
| ベンチマーク | Pro | Lite | Code | Mini |
|---|---|---|---|---|
| AIME 2025(数学) | 98.3 | 93.0 | — | 87.0 |
| GPQA Diamond(科学) | 88.9 | — | — | — |
| MMLU-Pro(知識) | 87.0 | 87.7 | — | — |
| LiveCodeBench v6 | — | — | 87.8 | — |
| SWE-Bench Verified | 76.5 | 73.5 | 76.5 | — |
| Codeforces レーティング | 3020 | — | — | — |
| VideoMME | 89.5 | — | — | — |
いくつか補足です:
- Liteの「奇妙さ」は本物です。 LiteはMMLU-ProでProをわずかに上回っています(87.7対87.0)。これはノイズではありません。Liteは知識量の多い蒸留データでポストトレーニングされており、Proは難しい推論の最適化を行っています。業務が「ドキュメントの要約」や「事実に基づく質問への回答」なら、Liteが本当に適切です。推論の連鎖が重要になる場合はProが適しています。
- CodeはSWE-Bench VerifiedでProと一致(76.5)。 これによりClaude Sonnet 4.6にかなり近い位置に入り、同じベンチマークではGPT-5.4-miniより前に出ています。$0.67/$3.36は、「実際に本物のコードベースを編集できる」系のティアで最安のモデルです。
- ProのCodeforces 3020は、真にフロンティア級です。比較として、GPT-5.5は同じ評価で約3050、Claude Opus 4.7は約2980あたりです。
- MiniはAIMEで87.0がサプライズです。これは、価格の一部でGPT-4oより高い数学スコアです。タイトなループの中で3.5クラス以上に賢いモデルを使いたい場合、Miniはなかなか抜けません。
ベンチマークが教えてくれないこと:Doubaoモデルは、依然として中国語の品質に強く寄っており、Proの英語長文のリコールは、~150Kトークンを超えるあたりからGemini 3.1 Proに比べて明確に弱くなります。英語のみのエージェント運用で深いコンテキストが必要なら、Geminiがまだ勝っています。混在言語、または中国語中心の作業なら、この価格帯で最も強い選択肢はDoubao Seed 2.0 Proです。
中国国外からDoubao Seed 2.0にアクセスする方法
現実的な選択肢は3つあります:
1. 直接 Volcengine ARK。 エンドポイント: https://ark.cn-beijing.volces.com/api/v3/chat/completions。最安の料金です。中国の電話+ID+Alipay/WeChat Payでチャージが必要です。中国国外を拠点とする多くのチームでは現実的に運用できません。
2. BytePlus(ByteDanceの国際部門)。 USD請求で、中国の電話は不要です。ただし本土ARKの約1.7倍の価格で、オンボーディング時にビジネス事業体の情報も求められます。企業向けには可能ですが、個人開発者にはつらいです。
3. OpenAI互換ゲートウェイ(ofox.ai)。 メール登録、国際カードでチャージ、Doubao+Claude+GPT+Gemini+DeepSeek+Qwenを1つのAPIキーで利用可能。料金は直接ARKとBytePlusの間です。多くの国際的な開発者が取るのがこの道で、下のセットアップ手順でもそれを前提にしています。
ゲートウェイ経由だと、直接ルートにはないものも手に入ります。それは「ワンラインのコード変更でのモデル切り替え」です。特定のワークロードでMiniの限界を超えたら、volcengine/doubao-seed-2.0-miniをvolcengine/doubao-seed-2.0-pro(または anthropic/claude-sonnet-4-6など)に差し替えるだけで、他のスタックは触らずに済みます。
セットアップ — Pythonで最初のDoubao Seed 2.0呼び出し
ofox.aiのAPIは完全にOpenAI互換です。もしopenaiのPython SDKを使ったことがあるなら、すでに形はわかっているはずです:
from openai import OpenAI
client = OpenAI(
api_key="sk-ofox-...", # from ofox.ai/dashboard
base_url="https://api.ofox.ai/v1",
)resp = client.chat.completions.create(
model="volcengine/doubao-seed-2.0-lite",
messages=[{"role": "user", "content": "2文でMoEのルーティングを説明してください。"}],
)
print(resp.choices[0].message.content)
以上です。OpenAIを直接呼び出す場合からの変更点は3つだけです。api_key、base_url、そしてmodelのスラッグです。それ以外は、ストリーミング、関数呼び出し、構造化出力、ツールの利用など、すべて同じSDKメソッド経由で動作します。
使用するDoubao Seed 2.0モデルのスラッグは4つです:
volcengine/doubao-seed-2.0-provolcengine/doubao-seed-2.0-codevolcengine/doubao-seed-2.0-litevolcengine/doubao-seed-2.0-mini
Proでのビジョン入力は、GPT-4oとまったく同じように、content配列に画像URLまたはbase64ペイロードを渡します。スキーマは同一です。関数呼び出しは、tools + tool_choice が同様に機能します。ofoxは、基盤となるVolcengine APIの癖(max_tokensとmax_completion_tokensで異なるパラメータ名、推論の「effort」フラグが微妙に異なるなど)をOpenAI標準の形に正規化するため、コードはきれいなままです。
Nodeから呼び出す場合は、npm install openaiに切り替えれば、同じ3つの変更が適用されます。
どのバリアントを選ぶべきか — ルーティングの意思決定ツリー
Proをデフォルトにしないでください。Seed 2.0ファミリーの狙いそのものが、コストに応じたルーティングです。実際の分岐は次の通りです:
Mini($0.06/$0.56)を使うのは:
- 分類、抽出、意図(インテント)ルーティング
- 文章の書き換え/凝縮をタイトなループで行う
- より高コストなモデルの前段で入力をプリフィルタする
- 埋め込み(embeddings)のプロンプト生成(クエリをLLMに整形させる必要がある場合)
Lite($0.13/$0.76)を使うのは:
- 一般的なチャット、カスタマーサポート、RAG生成
- ドキュメント要約(ここで効く決定打は256Kのコンテキストです)
- Miniの推論が継ぎ目(seams)を見せるようなコンテンツ生成
- フラッグシップ級の推論を必要としない依頼の80%に対するデフォルトの主力(ワークホース)
Code($0.67/$3.36)を使うのは:
- 実ファイルを編集するエージェントの中にいる
- コードレビュー、リファクタリング提案、テスト生成
- SWE-Benchのような複数ファイルにまたがる推論が重要になるもの
- コーディング以外のタスクに使わないでください。Proと同じ価格を払うなら、より汎用的なヘッドを得るべきです
Pro($0.67/$3.36)を使うのは:
- 数学、科学的推論、マルチステップ計画
- マルチモーダル(画像+動画)の理解
- 中国語の作業(Doubaoの学習上の優位が出ます)
- Liteを試して、「連鎖的な推論(chain-of-reasoning)」で壊れた
コスト効率のよいスタックは通常:デフォルトはLite、そこから必要な依頼の5〜10%だけProへエスカレーション、です。エージェントのループを動かしている場合は、ファイル編集のステップはCodeに、推論ステップはProにルーティングします。
Doubao Seed 2.0 と他の低価格帯APIの比較
すべての開発者が抱く疑問:同じ価格帯で、これはDeepSeekやQwenより本当に良いのか?
| モデル | 入力 $/MTok | 出力 $/MTok | SWE-Bench V. | AIME 2025 | コンテキスト |
|---|---|---|---|---|---|
| Doubao Seed 2.0 Pro | $0.67 | $3.36 | 76.5 | 98.3 | 256K |
| Doubao Seed 2.0 Lite | $0.13 | $0.76 | 73.5 | 93.0 | 256K |
| DeepSeek V4 Pro | $1.74 | $3.48 | 72.0 | 95.5 | 1M |
| DeepSeek V4 Flash | $0.14 | $0.28 | 65.8 | 88.0 | 1M |
| Qwen 3.6 Plus | $0.50 | $3.00 | 78.8 | 94.1 | 1M |
| Kimi K2.5 | $0.60 | $3.00 | 71.0 | 90.5 | 256K |
このマトリクスが実際に示していること:
- Doubao Lite vs DeepSeek V4 Flash は、ベンダー横断で最も面白い組み合わせです。V4 Flashは両端で安く($0.14/$0.28 vs $0.13/$0.76)、さらに4倍の大きさの1Mコンテキストウィンドウを提供しますが、SWE-BenchではLiteが意味のある差で高得点です。出力コストが支配的になる短いコンテキストでの大量処理ではV4 Flashがより安くつきます。一方で「見出し価格よりも推論の質が重要」なタスクでは、Liteは依然としてトークンあたりの品質で勝ちます。
- Doubao Pro vs Qwen 3.6 Plus は、価格差ほど遠くありません。QwenはSWE-Bench Verified(78.8 vs 76.5)でわずかに高く、出力コストもわずかに低いです($3.00 vs $3.36)。さらに1Mのコンテキストウィンドウを提供しますが、Doubao Proは数学(AIME 98.3 vs 94.1)とマルチモーダルでより強力です。長いコンテキストの純粋なコーディングならQwenが勝ちます。エージェント的なマルチモーダル作業や難しい数学ならDoubao Proです。
- Doubao Mini(入力$0.06) は、真面目に運用するモデルにとっての下限です。より安いオープンウェイトモデルは存在しますが、このベンチマーク帯でホストされ、サポートされているものはありません。
より広い全体像:2026年は、中国ベンダーのフロンティアモデルが、ベンチマーク性能を犠牲にせずに価格の下限を破った年です。
制限と落とし穴
コミットする前に、いくつか知っておくべきことがあります。
英語のみの長文コンテキスト。 Proは約150Kトークンを超えると、英語中心のドキュメントで顕著なリコール(想起)劣化が見られます。ByteDanceは中国語向けに最適化されています。長文コンテキストのベンチマーク数値はその反映です。200K以上の英語のみの作業なら、Gemini 3.1 Proの方がまだ適しています。
関数呼び出しの癖。 Doubaoのツール利用スキーマはClaudeよりも控えめです。Claudeならツール呼び出しする場面でも、Doubaoがためらって呼ばないことが時々あります。Claude CodeやCodex CLIからエージェントを移植する場合は、ツール利用をより指示的にするようにシステムプロンプトを締める(厳密にする)ことを想定してください。
推論モードのトークンは全額カウント。 Proの「thinking」出力(推論チェーン)は、出力レートでそのまま課金されます。内部の推論トークンを割引する一部のプロバイダとは異なり、ByteDanceはすべて課金します。難しい問題で長い推論チェーンになると、出力コストが簡単に$0.50以上に到達することがあります。見積もりに反映してください。
USのデータ所在(データレジデンシ)オプションがない(現時点では)。 すべてのDoubao Seed 2.0推論は、ByteDanceのインフラ上で実行されます。中国本土(直)またはシンガポール/香港(ゲートウェイ経由)です。コンプライアンスでUSのデータ所在が必須なら、これは成立しません。その場合はClaude、GPT、またはGeminiを使ってください。
レート制限は、見出しの価格提示が示すよりもずっと厳しめです。 Volcengine の直販のデフォルトティアは、最初は約5 RPSから始まり、利用履歴に応じてスケールします。ofox はこれを統一キューとして抽象化しているため、多くのユーザーは違いに気づかないでしょう。しかし、バースト量の多いものを作っているなら、リトライ時のバックオフ戦略を用意しておいてください。
最終結論
Doubao Seed 2.0 は、「中国ベンダーのLLM」がもはや「低価格=低品質」に対応しないことを、これまでで最も明確に示すシグナルです。今やそれは「米国のフラッグシップと同等のベンチマークを、意味のある低価格で提供する」という形に対応しています。数学のハードさに関しての Pro は、GPT-5.2 および Claude Opus 4.6 と本当に競争力があります。$0.13/MTok の Lite は、今日市場で最もコスパの良い実働用ワークホースです。$0.06/MTok の Mini は、本番運用で使う価値のあるモデルの下限です。
ただし落とし穴はアクセスです。Volcengine の直登録は、中国国外の開発者にとっては壁であり、BytePlus のエンタープライズ向けは個人開発者には過剰です。ofox.ai のような OpenAI 互換ゲートウェイがそれを「メール登録、APIキー1つ、文字列を変えるだけでモデルを切り替える」に平坦化します。
$0.13/MTok の Lite、256K コンテキストで MMLU-Pro は 87.7。もし、まだ 10倍の価格の GPT-4 クラスモデルに中位ティアの作業を回しているなら、間違ったベンダーに資金を投じています。決める前に、実運用のワークロードで Lite を試してみてください。
トークンコストがスケールにおいて重要になるものを作っているなら——エージェント、RAG パイプライン、大量のコンテンツ生成など——トラフィックの一部を Seed 2.0 Lite あるいは Mini に切り替える作業を半日使い、現在のモデルに対する品質差を測定してください。価格面でのレバレッジは、2026年のあらゆるモデルリリースの中で最大です。
もともと ofox.ai/blog に掲載されました。



