実世界のクラウドソーシングによるテキスト注釈を用いたアクティブ・ラーニング手法の分析
arXiv cs.LG / 2026/4/28
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、誤ったりラベル付けを拒否したりする可能性のあるクラウドソーシング環境におけるテキスト分類のアクティブ・ラーニングを扱っています。
- MLモデルでノイジーな注釈者を疑似的に再現するのではなく、3つのベンチマーク・テキスト分類データセットから実際のクラウドソーシング注釈を収集しています。
- 収集した注釈を用いて、深層ニューラルネットワークと組み合わせた8つの代表的なアクティブ・ラーニング手法を大規模な実験で評価します。
- 注釈者が誤ったクラスラベルを提示する、または応答しないといった実世界の課題下で、各手法の性能を分析し、実運用に向けた示唆を提供します。
- クラウドソーシング注釈のデータは、さらなる研究のためにGitHubで公開されています。




