テキストスパンを解読して効率的かつ高精度な固有表現認識(NER)を実現する
arXiv cs.CL / 2026/4/23
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、スパンベースの固有表現認識(NER)で起きがちな推論コストの高さを問題としており、多数の候補スパンを列挙して各候補に対してマーカー拡張入力を処理することが大きな要因だと述べています。
- SpanDecと呼ばれる効率的なスパンベースNERフレームワークを提案し、スパン表現同士の相互作用を主に最終トランスフォーマ層で計算することで、軽量なスパン専用デコーダを用いて初期層での冗長な計算を避けます。
- さらに、候補列挙の段階でスパンをフィルタリングし、起こりにくい候補を高コスト処理の前に削除(プルーニング)する仕組みを導入します。
- 複数のベンチマークで、SpanDecは競争力のある精度を維持しつつ、スループットを向上させ計算コストを削減することで、クラウドでの大量配信や端末上での利用に適した精度–効率のバランスを示しています。




