ADE(Adaptive Dictionary Embeddings)—マルチアンカー表現を大規模言語モデルへスケールする
arXiv cs.CL / 2026/4/29
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、従来は計算効率の問題で大規模モデルに適用しにくかったマルチアンカーの単語表現を、大規模言語モデル系のアーキテクチャにスケールさせる枠組み「Adaptive Dictionary Embeddings(ADE)」を提案します。
- ADEの中核は、Vocabulary Projection(高コストなアンカー検索を効率的な行列演算に置き換える)、Grouped Positional Encoding(同一語に属するアンカー間で位置情報を共有しつつアンカーごとの変化を可能にする)、自己注意に基づく文脈対応のアンカー再重み付けの3点です。
- ADEはSegment-Aware Transformer(SAT)に統合され、推論時に文脈に応じたアンカーの重み付けを行います。
- AG NewsとDBpedia-14で評価したところ、学習可能パラメータがDeBERTa-v3-baseに対して98.7%削減される一方で、DBpedia-14ではDeBERTaを上回り、AG Newsでも近い性能に到達し、埋め込み層は40倍超で圧縮できることを示しています。
- これらの結果から、マルチアンカー表現は単一ベクトルの単語埋め込みに対する、実用的でパラメータ効率の高い代替になり得ることが示唆されます。



