AI Navigate

インサイト最新記事一覧 AI大全

広告

ゼロアロケーションのヘッダオンリーC++ Qwenトークナイザーを構築：OpenAIのTiktokenより約20倍高速

Reddit r/LocalLLaMA / 2026/4/4

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisTools & Practical Usage

原文を読む →

共有:

要点

開発者が「Frokenizer」を作成しました。これはQwenトークナイザーフォーマットに特化したヘッダオンリーのゼロアロケーションC++トークナイザーで、LLM開発者を対象としています。
著者は、12スレッドのRyzen 5 3600で、1GBの英語コーパスのテストにおいて、スループットが約1009 MB/sに達する一方で、OpenAIのTiktokenは約50 MB/sだったと主張しています。
このプロジェクトは、生産用途としての必須要件というよりも、BPEトークナイゼーションと最適化手法を理解するための教育・HPC（高性能計算）向けのベンチマーク取り組みとして位置付けられています（トークナイゼーションは推論時間の多くで~2%未満であることが指摘されています）。
ベンチマークと実装の詳細は、投稿内でリンクされているGitHubリポジトリ経由で他の人がテスト・検証できるように提供されています。

割り当てゼロ、ヘッダーのみのC++ Qwenトークナイザを作った。OpenAI Tiktokenより約20倍高速

私はHPCや、C++の静的で、割り当てゼロ＆依存ゼロのソフトウェアに興味があります。BPEトークナイザがどう動くのかを勉強していて、そのプロジェクトを作ることにしました。LLM開発者向けに、qwenトークナイザをハードコードしました。

LLM推論におけるトークナイズのフェーズは全体の時間の2%未満で、実際にはほぼ無視できることはよく分かっていますが、私はそういう種類のプログラミングが「本当に」好きなんです。学習と直感を作るための教育用プロジェクトです。

驚いたことに、複数の異なる最適化手法を組み合わせた後、ベンチマークでかなり高い数値が出ました。最初は偶然だと思っていろいろなテストを試しましたが、これまでのところ完全に期待に応えています。

12スレッドのRyzen 5 3600デスクトップCPUで、英語テキストコーパス1 GBの場合：
- Mine Frokenizer: 1009 MB/s
- OpenAI Tiktoken: 約 50 MB/s

コード、テスト、ベンチマークについて：
https://github.com/yassa9/frokenizer

投稿者 /u/yassa9
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

Black Hat Asia

Black Hat Asia

AI Business

Claude Codeのソース漏えい、OpenAIは動画生成を撤退、Geminiは音楽生成を追加、LLMは推論時に学習する

Claude Codeのソース漏えい、OpenAIは動画生成を撤退、Geminiは音楽生成を追加、LLMは推論時に学習する

The Batch

フィジカルAIに沸く建設業、i-Constructionの教訓生かしプロセス変革に踏み込め

フィジカルAIに沸く建設業、i-Constructionの教訓生かしプロセス変革に踏み込め

日経XTECH

Windows 11で「メモ帳」が進化、マークダウン形式や生成AIを利用可能に

Windows 11で「メモ帳」が進化、マークダウン形式や生成AIを利用可能に

日経XTECH

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告