モデルは、ある瞬間には完璧に動作し、次の瞬間には劣化することがあります――しかも、データ、パイプライン、ロジックに何の変更もありません。根本原因は、多くの場合、もっと見えにくい何かにあります。つまり、入力がどのようにトークン化されるかです。モデルがテキストを処理する前に、それをトークンIDに変換しますが、スペース、改行、句読点などのわずかな書式の違いでも、[…]
この記事 What is Tokenization Drift and How to Fix It? は最初に MarkTechPost に掲載されました。




