LLM 開発の基礎:トークン・コンテキスト・料金

AI Navigate Original / 2026/5/16

共有:

要点

  • LLM開発前にトークン・コンテキスト・料金を押さえる。日本語は英語の1.5〜2倍トークン
  • コンテキストは入出力合計、2026は~100万級だが変動大で公式確認。長文は中盤が抜けるのでRAG/分割
  • 料金は変動が激しいので金額表は載せない。傾向のみ:出力が高い/軽量は桁違いに安い/キャッシュ・Batchで割引
  • 本番はRate Limit・Latency・Streaming・Tool Use/構造化出力も押さえる

LLM の API を初めて触る前に、トークン・コンテキスト・料金の 3 つだけは押さえておくと、コードもコスト試算も一気に見通しが良くなります。この 3 つは互いにつながっていて、「テキストはトークンに分解される → 一度に渡せるトークン数(コンテキスト)に上限がある → 使ったトークン数で課金される」という一本の流れになっています。本記事ではその流れを、2026 年時点の実際のモデルや仕組みを例にしながら、図とともに整理します。

入力テキスト トークン列 コンテキスト 入力+出力の枠 ¥ トークンで課金 料金

FIG.1 テキスト → トークン分解 → コンテキスト枠に収める → 使った量で課金、という一本の流れ

01トークン ── LLM が読む最小単位

LLM はテキストを「単語」ではなくトークンという小さな断片に分けて処理します。トークンは単語そのもののこともあれば、単語の一部・記号・空白のこともあります。たとえば tokenization のような語は tokenization のように複数トークンに割れますし、スペースや改行も 1 トークンとして数えられます。料金もコンテキストの上限も、このトークン数を基準に決まるため、まず「文字数ではなくトークン数で考える」癖をつけるのが出発点です。

  • 英語:おおむね 1 単語 ≈ 1.3 トークン、1 トークン ≈ 4 文字が目安。
  • 日本語:BPE 系のトークナイザではほぼ 1 文字 ≈ 1 トークンになりやすく、同じ意味の文でも英語の 3〜4 倍のトークンを食うことがある。漢字・かなで増減する。
  • コード:インデントの空白・記号・括弧もすべてトークンとして数えられる。
  • 画像・音声・動画:マルチモーダル入力もトークン換算で課金される(換算ルールは API ごとに異なるので公式を確認)。

トークン数を確認する方法

「このプロンプトは何トークンか」を事前に知りたい場面は多いです。提供元によって手段が異なります。

OpenAI(公開トークナイザ)Anthropic / Google(非公開)
tiktoken ライブラリや Web の Tokenizer ツールで、手元で正確に数えられるトークナイザが公開されていないため、専用 API(Anthropic の count tokens など)か経験的な概算で見積もる
事前に厳密なトークン数が分かる「英語 4 文字 ≈ 1 トークン/日本語はほぼ 1 文字 1 トークン」の目安で当たりを付ける

トークン量の感覚値

続きを読むには無料登録が必要です

アカウントを作成すると、オリジナル記事の全文をお読みいただけます。