Doubao Seed 2.0 APIガイド:ByteDanceの低価格LLM(2026)—料金・セットアップ・ベンチマーク

Dev.to / 2026/5/20

📰 ニュースTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • ByteDanceは2026年2月14日に、共通のベースチェックポイントから派生して特化された複数バリアントを含む「Doubao Seed 2.0」フロンティアLLMファミリーをリリースし、Doubaoの消費者向けチャットボットの中核エンジンとして位置付けています。
  • バリアントはPro、Code、Lite、Miniの4段階で、最上位の推論・マルチモーダル、ソフトウェア開発寄りのコード作業、汎用用途のバランス型、低コストの高並列ワークフローに対応します。
  • すべてのモデルは256Kトークンのコンテキスト(最大32K出力)を提供し、視覚入力、関数呼び出し、プロンプトキャッシュ、構造化出力に対応します;ProとCodeは拡張された「thinking」モードを追加し、Proは動画入力にも対応しています。
  • 国際開発者向けには、Volcengine ARKの直接ルート(中国の電話番号/本人確認が必要)と、ofox.aiのOpenAI互換ゲートウェイ(USD請求、本人確認不要)を比較し、各ティアの検証済みの従量料金(入力/出力単価)を提示しています。
  • 競合の公表価格と比べると、Doubao Seed 2.0 Proは複数のトップ競合より大幅に安い水準にあり、Miniはさらに低価格のバジェット選択肢として高頻度ユースケース向けに位置付けられています。

Doubao Seed 2.0とは?

Doubao Seed 2.0は、ByteDanceのフロンティア級LLMファミリーで、2026年2月14日にリリースされました。Doubaoのコンシューマーアプリ(MAUで中国最大のAIチャットボット)の基盤となるエンジンです。「Seed」という名称はByteDanceの社内研究ラボを指しており、2.0ファミリーの各バリアントはすべて同一のベースチェックポイントからポストトレーニングされ、その後それぞれに特化されています。

バリアントは4種類あります:

  • Seed 2.0 Pro — 主力の推論+マルチモーダル。Claude Opus / GPT-5.2 / Gemini 3 Proと競合
  • Seed 2.0 Code — Proと同価格。ソフトウェアエンジニアリングのタスク向けにポストトレーニング
  • Seed 2.0 Lite — バランスの取れた汎用型。コストの一部で中位層の米国モデルと競合
  • Seed 2.0 Mini — 低価格帯の実務担当。高い同時実行ループ(分類、抽出、軽量エージェント)向けに設計

4種類すべてが256Kトークンのコンテキストウィンドウ(最大32Kの出力トークン)を共有し、4種類すべてがビジョン入力、関数呼び出し、プロンプトキャッシュ、構造化出力をサポートします。ProとCodeはさらに拡張推論(「thinking」モード)に対応し、Proはビデオ入力にも対応しています。

Doubao Seed 2.0の料金 — 実際にあなたが払う金額

国際的な開発者にとって重要なのは、2つの料金体系です。

直接 Volcengine ARK(中国): 中国の電話番号が必要で、住民IDの本人確認(本土ID検証)と、AlipayまたはWeChat PayによるCNYのチャージが必要です。これらのハードルをクリアできるなら最安です。

ofox.ai OpenAI互換ゲートウェイ: USD請求、メール登録、そして中国のID不要。直接ARKに対するゲートウェイ側の適度な上乗せはありますが、同じキーでClaude、GPT、Gemini、DeepSeek、Qwenも利用できます。

以下は、ofox経由で各ティアが実際にいくらかかるか(2026-05-20時点の ofox.ai/llms-full.txt による検証済み)です:

バリアント 入力 ($/MTok) 出力 ($/MTok) コンテキスト 最適用途
Seed 2.0 Mini $0.06 $0.56 256K 大量の分類、抽出、軽量ルーティング
Seed 2.0 Lite $0.13 $0.76 256K 汎用チャット、RAG、コンテンツ生成
Seed 2.0 Code $0.67 $3.36 256K コード生成、リファクタリング、ファイル編集を伴うエージェントループ
Seed 2.0 Pro $0.67 $3.36 256K 難しい推論、数学、ビジョン、多段階の計画

参考までに、GPT-5.2は$1.75/$14.00 per MTok、Claude Opus 4.6は$5.00/$25.00、Gemini 3.1 Proは$2.00/$12.00です。Doubao Seed 2.0 Proは$0.67/$3.36で、まったく別の価格帯に位置しています。Miniは$0.06/$0.56で、さらに別です。

Pro/Codeの価格同等(トークンあたりの同一価格)は意図的です。ByteDanceはCodeを、コーディングに特化したヘッドを持つProとして扱っています。いずれにせよフラッグシップ料金を支払うので、「必要なポストトレーニングがどちらか」で選んでください。

ベンチマーク — 各バリアントが実際にどれだけ出せるか

ByteDanceのリリース資料および第三者評価(apiyi.com, datalearner.com, evolink.ai)から得られる公開ベンチマークスコアを、2026-05-20時点の情報と突き合わせています:

ベンチマーク Pro Lite Code Mini
AIME 2025(数学) 98.3 93.0 87.0
GPQA Diamond(科学) 88.9
MMLU-Pro(知識) 87.0 87.7
LiveCodeBench v6 87.8
SWE-Bench Verified 76.5 73.5 76.5
Codeforces レーティング 3020
VideoMME 89.5

いくつか補足です:

  • Liteの「奇妙さ」は本物です。 LiteはMMLU-ProでProをわずかに上回っています(87.7対87.0)。これはノイズではありません。Liteは知識量の多い蒸留データでポストトレーニングされており、Proは難しい推論の最適化を行っています。業務が「ドキュメントの要約」や「事実に基づく質問への回答」なら、Liteが本当に適切です。推論の連鎖が重要になる場合はProが適しています。
  • CodeはSWE-Bench VerifiedでProと一致(76.5)。 これによりClaude Sonnet 4.6にかなり近い位置に入り、同じベンチマークではGPT-5.4-miniより前に出ています。$0.67/$3.36は、「実際に本物のコードベースを編集できる」系のティアで最安のモデルです。
  • ProのCodeforces 3020は、真にフロンティア級です。比較として、GPT-5.5は同じ評価で約3050、Claude Opus 4.7は約2980あたりです。
  • MiniはAIMEで87.0がサプライズです。これは、価格の一部でGPT-4oより高い数学スコアです。タイトなループの中で3.5クラス以上に賢いモデルを使いたい場合、Miniはなかなか抜けません。

ベンチマークが教えてくれないこと:Doubaoモデルは、依然として中国語の品質に強く寄っており、Proの英語長文のリコールは、~150Kトークンを超えるあたりからGemini 3.1 Proに比べて明確に弱くなります。英語のみのエージェント運用で深いコンテキストが必要なら、Geminiがまだ勝っています。混在言語、または中国語中心の作業なら、この価格帯で最も強い選択肢はDoubao Seed 2.0 Proです。

中国国外からDoubao Seed 2.0にアクセスする方法

現実的な選択肢は3つあります:

1. 直接 Volcengine ARK。 エンドポイント: https://ark.cn-beijing.volces.com/api/v3/chat/completions。最安の料金です。中国の電話+ID+Alipay/WeChat Payでチャージが必要です。中国国外を拠点とする多くのチームでは現実的に運用できません。

2. BytePlus(ByteDanceの国際部門)。 USD請求で、中国の電話は不要です。ただし本土ARKの約1.7倍の価格で、オンボーディング時にビジネス事業体の情報も求められます。企業向けには可能ですが、個人開発者にはつらいです。

3. OpenAI互換ゲートウェイ(ofox.ai)。 メール登録、国際カードでチャージ、Doubao+Claude+GPT+Gemini+DeepSeek+Qwenを1つのAPIキーで利用可能。料金は直接ARKとBytePlusの間です。多くの国際的な開発者が取るのがこの道で、下のセットアップ手順でもそれを前提にしています。

ゲートウェイ経由だと、直接ルートにはないものも手に入ります。それは「ワンラインのコード変更でのモデル切り替え」です。特定のワークロードでMiniの限界を超えたら、volcengine/doubao-seed-2.0-minivolcengine/doubao-seed-2.0-pro(または anthropic/claude-sonnet-4-6など)に差し替えるだけで、他のスタックは触らずに済みます。

セットアップ — Pythonで最初のDoubao Seed 2.0呼び出し

ofox.aiのAPIは完全にOpenAI互換です。もしopenaiのPython SDKを使ったことがあるなら、すでに形はわかっているはずです:

from openai import OpenAI

client = OpenAI(
    api_key="sk-ofox-...",  # from ofox.ai/dashboard
    base_url="https://api.ofox.ai/v1",
)resp = client.chat.completions.create(
    model="volcengine/doubao-seed-2.0-lite",
    messages=[{"role": "user", "content": "2文でMoEのルーティングを説明してください。"}],
)
print(resp.choices[0].message.content)

以上です。OpenAIを直接呼び出す場合からの変更点は3つだけです。api_keybase_url、そしてmodelのスラッグです。それ以外は、ストリーミング、関数呼び出し、構造化出力、ツールの利用など、すべて同じSDKメソッド経由で動作します。

使用するDoubao Seed 2.0モデルのスラッグは4つです:

  • volcengine/doubao-seed-2.0-pro
  • volcengine/doubao-seed-2.0-code
  • volcengine/doubao-seed-2.0-lite
  • volcengine/doubao-seed-2.0-mini

Proでのビジョン入力は、GPT-4oとまったく同じように、content配列に画像URLまたはbase64ペイロードを渡します。スキーマは同一です。関数呼び出しは、tools + tool_choice が同様に機能します。ofoxは、基盤となるVolcengine APIの癖(max_tokensmax_completion_tokensで異なるパラメータ名、推論の「effort」フラグが微妙に異なるなど)をOpenAI標準の形に正規化するため、コードはきれいなままです。

Nodeから呼び出す場合は、npm install openaiに切り替えれば、同じ3つの変更が適用されます。

どのバリアントを選ぶべきか — ルーティングの意思決定ツリー

Proをデフォルトにしないでください。Seed 2.0ファミリーの狙いそのものが、コストに応じたルーティングです。実際の分岐は次の通りです:

Mini($0.06/$0.56)を使うのは:

  • 分類、抽出、意図(インテント)ルーティング
  • 文章の書き換え/凝縮をタイトなループで行う
  • より高コストなモデルの前段で入力をプリフィルタする
  • 埋め込み(embeddings)のプロンプト生成(クエリをLLMに整形させる必要がある場合)

Lite($0.13/$0.76)を使うのは:

  • 一般的なチャット、カスタマーサポート、RAG生成
  • ドキュメント要約(ここで効く決定打は256Kのコンテキストです)
  • Miniの推論が継ぎ目(seams)を見せるようなコンテンツ生成
  • フラッグシップ級の推論を必要としない依頼の80%に対するデフォルトの主力(ワークホース)

Code($0.67/$3.36)を使うのは:

  • 実ファイルを編集するエージェントの中にいる
  • コードレビュー、リファクタリング提案、テスト生成
  • SWE-Benchのような複数ファイルにまたがる推論が重要になるもの
  • コーディング以外のタスクに使わないでください。Proと同じ価格を払うなら、より汎用的なヘッドを得るべきです

Pro($0.67/$3.36)を使うのは:

  • 数学、科学的推論、マルチステップ計画
  • マルチモーダル(画像+動画)の理解
  • 中国語の作業(Doubaoの学習上の優位が出ます)
  • Liteを試して、「連鎖的な推論(chain-of-reasoning)」で壊れた

コスト効率のよいスタックは通常:デフォルトはLite、そこから必要な依頼の5〜10%だけProへエスカレーション、です。エージェントのループを動かしている場合は、ファイル編集のステップはCodeに、推論ステップはProにルーティングします。

Doubao Seed 2.0 と他の低価格帯APIの比較

すべての開発者が抱く疑問:同じ価格帯で、これはDeepSeekやQwenより本当に良いのか?

モデル 入力 $/MTok 出力 $/MTok SWE-Bench V. AIME 2025 コンテキスト
Doubao Seed 2.0 Pro $0.67 $3.36 76.5 98.3 256K
Doubao Seed 2.0 Lite $0.13 $0.76 73.5 93.0 256K
DeepSeek V4 Pro $1.74 $3.48 72.0 95.5 1M
DeepSeek V4 Flash $0.14 $0.28 65.8 88.0 1M
Qwen 3.6 Plus $0.50 $3.00 78.8 94.1 1M
Kimi K2.5 $0.60 $3.00 71.0 90.5 256K

このマトリクスが実際に示していること:

  • Doubao Lite vs DeepSeek V4 Flash は、ベンダー横断で最も面白い組み合わせです。V4 Flashは両端で安く($0.14/$0.28 vs $0.13/$0.76)、さらに4倍の大きさの1Mコンテキストウィンドウを提供しますが、SWE-BenchではLiteが意味のある差で高得点です。出力コストが支配的になる短いコンテキストでの大量処理ではV4 Flashがより安くつきます。一方で「見出し価格よりも推論の質が重要」なタスクでは、Liteは依然としてトークンあたりの品質で勝ちます。
  • Doubao Pro vs Qwen 3.6 Plus は、価格差ほど遠くありません。QwenはSWE-Bench Verified(78.8 vs 76.5)でわずかに高く、出力コストもわずかに低いです($3.00 vs $3.36)。さらに1Mのコンテキストウィンドウを提供しますが、Doubao Proは数学(AIME 98.3 vs 94.1)とマルチモーダルでより強力です。長いコンテキストの純粋なコーディングならQwenが勝ちます。エージェント的なマルチモーダル作業や難しい数学ならDoubao Proです。
  • Doubao Mini(入力$0.06) は、真面目に運用するモデルにとっての下限です。より安いオープンウェイトモデルは存在しますが、このベンチマーク帯でホストされ、サポートされているものはありません。

より広い全体像:2026年は、中国ベンダーのフロンティアモデルが、ベンチマーク性能を犠牲にせずに価格の下限を破った年です。

制限と落とし穴

コミットする前に、いくつか知っておくべきことがあります。

英語のみの長文コンテキスト。 Proは約150Kトークンを超えると、英語中心のドキュメントで顕著なリコール(想起)劣化が見られます。ByteDanceは中国語向けに最適化されています。長文コンテキストのベンチマーク数値はその反映です。200K以上の英語のみの作業なら、Gemini 3.1 Proの方がまだ適しています。

関数呼び出しの癖。 Doubaoのツール利用スキーマはClaudeよりも控えめです。Claudeならツール呼び出しする場面でも、Doubaoがためらって呼ばないことが時々あります。Claude CodeやCodex CLIからエージェントを移植する場合は、ツール利用をより指示的にするようにシステムプロンプトを締める(厳密にする)ことを想定してください。

推論モードのトークンは全額カウント。 Proの「thinking」出力(推論チェーン)は、出力レートでそのまま課金されます。内部の推論トークンを割引する一部のプロバイダとは異なり、ByteDanceはすべて課金します。難しい問題で長い推論チェーンになると、出力コストが簡単に$0.50以上に到達することがあります。見積もりに反映してください。

USのデータ所在(データレジデンシ)オプションがない(現時点では)。 すべてのDoubao Seed 2.0推論は、ByteDanceのインフラ上で実行されます。中国本土(直)またはシンガポール/香港(ゲートウェイ経由)です。コンプライアンスでUSのデータ所在が必須なら、これは成立しません。その場合はClaude、GPT、またはGeminiを使ってください。

レート制限は、見出しの価格提示が示すよりもずっと厳しめです。 Volcengine の直販のデフォルトティアは、最初は約5 RPSから始まり、利用履歴に応じてスケールします。ofox はこれを統一キューとして抽象化しているため、多くのユーザーは違いに気づかないでしょう。しかし、バースト量の多いものを作っているなら、リトライ時のバックオフ戦略を用意しておいてください。

最終結論

Doubao Seed 2.0 は、「中国ベンダーのLLM」がもはや「低価格=低品質」に対応しないことを、これまでで最も明確に示すシグナルです。今やそれは「米国のフラッグシップと同等のベンチマークを、意味のある低価格で提供する」という形に対応しています。数学のハードさに関しての Pro は、GPT-5.2 および Claude Opus 4.6 と本当に競争力があります。$0.13/MTok の Lite は、今日市場で最もコスパの良い実働用ワークホースです。$0.06/MTok の Mini は、本番運用で使う価値のあるモデルの下限です。

ただし落とし穴はアクセスです。Volcengine の直登録は、中国国外の開発者にとっては壁であり、BytePlus のエンタープライズ向けは個人開発者には過剰です。ofox.ai のような OpenAI 互換ゲートウェイがそれを「メール登録、APIキー1つ、文字列を変えるだけでモデルを切り替える」に平坦化します。

$0.13/MTok の Lite、256K コンテキストで MMLU-Pro は 87.7。もし、まだ 10倍の価格の GPT-4 クラスモデルに中位ティアの作業を回しているなら、間違ったベンダーに資金を投じています。決める前に、実運用のワークロードで Lite を試してみてください。

トークンコストがスケールにおいて重要になるものを作っているなら——エージェント、RAG パイプライン、大量のコンテンツ生成など——トラフィックの一部を Seed 2.0 Lite あるいは Mini に切り替える作業を半日使い、現在のモデルに対する品質差を測定してください。価格面でのレバレッジは、2026年のあらゆるモデルリリースの中で最大です。

もともと ofox.ai/blog に掲載されました。