実世界タスクのために、あまり知られていないエンティティを分類することを可能にする動的なテキスト獲得
arXiv cs.CL / 2026/4/27
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、エンティティ分類において、あまり知られていない/新しく導入されたエンティティに必要なタスク特化情報が既存NLPリソースでは不足している点に対し、エンティティ名と正解ラベルだけで学習できる仕組みを提案する。
- ドメインに合わせて各エンティティの記述文を動的に獲得するフレームワークを提示し、その獲得方法としてウェブ情報とLLM(大規模言語モデル)を組み合わせる新規手法を用いる。
- 獲得したエンティティ記述文を基に、対象タクソノミとタスクに適したテキストベースの分類器を作る。
- 実世界の2つの分類課題(企業をSICコードへ分類、医療提供者を医療タクソノミコードへ分類)で評価し、最良のマクロF1がそれぞれ82.3%(SIC)と72.9%(医療)を達成した。
- 事前に大規模なタスク特化コーパスを用意しなくても、ドメインの専門家がタスク別の分類器を作りやすくすることを狙っている。




