大規模言語モデルにおける効率的な不確実性定量化のための意味的トークンクラスタリング

arXiv cs.CL / 2026/3/23

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

意味的トークンクラスタリング（STC）を導入します。これは、繰り返しのサンプリングや補助モデルを回避することで、大規模言語モデルにおける効率的な不確実性定量化を実現する手法です。
STCは埋め込みクラスタリングとプレフィックスマッチングを用いて、意味的に整合したグループにトークンをクラスタリングし、これらのクラスタ上の確率質量を用いて不確実性を測定します。
本手法は生成を1回だけ行うだけで済み、最先端のベースラインに匹敵する一方で、計算オーバーヘッドを大幅に削減します。
重い計算資源を要さず信頼性を向上させることにより、STCは実用的なデプロイメントにおいてLLMの出力をより信頼できるものにする可能性があります。