大規模言語モデルは有効な人手アノテーション支援者だが、独立したアノテータとしては不十分
arXiv cs.CL / 2026/4/29
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、無関係な文書を除外し、同一の出来事に関する文書を統合したうえで、出来事をアノテーションする「統合的なイベントアノテーション」ワークフローを評価している。
- LLMベースの自動アノテーションは、従来のTF-IDF系手法やイベントセットキュレーションよりも優れている一方、専門家の人手アノテーションと比べると信頼性はまだ低い。
- LLMを専門家主導のイベントセットキュレーションに組み込むことで、変数アノテーションにおける専門家の作業時間と精神的負担を大きく減らせることが示されている。
- さらに、LLMに出来事変数の抽出をさせて専門家のアノテーションを補助すると、完全に自動化されたLLMによるアノテーションよりも、抽出された変数との一致度が高くなる。
- 総じて、LLMは独立したコーダではなく、アノテーション支援者として用いるのが適しているという示唆が得られる。


