テキストスパンを解読して効率的かつ高精度な固有表現認識(NER)を実現する

arXiv cs.CL / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文は、スパンベースの固有表現認識(NER)で起きがちな推論コストの高さを問題としており、多数の候補スパンを列挙して各候補に対してマーカー拡張入力を処理することが大きな要因だと述べています。
  • SpanDecと呼ばれる効率的なスパンベースNERフレームワークを提案し、スパン表現同士の相互作用を主に最終トランスフォーマ層で計算することで、軽量なスパン専用デコーダを用いて初期層での冗長な計算を避けます。
  • さらに、候補列挙の段階でスパンをフィルタリングし、起こりにくい候補を高コスト処理の前に削除(プルーニング)する仕組みを導入します。
  • 複数のベンチマークで、SpanDecは競争力のある精度を維持しつつ、スループットを向上させ計算コストを削減することで、クラウドでの大量配信や端末上での利用に適した精度–効率のバランスを示しています。