SemEval-2026 Task 9におけるBITS Pilani:偏向検出のためのDPOによる洗練を伴う構造化された教師あり微調整
arXiv cs.CL / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- SemEval-2026 Task 9(POLAR)は、オンライン上の偏向を多言語・多文化・複数イベントの観点から検出することを対象としている。ここでは、微妙な修辞と暗黙的な枠組み付けが注釈を高コストかつ誤りやすくしている。
- BITS Pilaniの手法は、2段階パイプラインを用いる。すなわち、解釈可能なスロット埋め込みテンプレートによりLoRAを使ってQwen 2.5-7B-Instructを構造化された教師あり微調整で学習し、続いて自動生成した嗜好ペアを用いたDPOによる洗練を行う。
- 嗜好ベースのDPOは、人手による追加のループ(human-in-the-loop)注釈を必要とせずに、コストの高い偽陰性を低減することを目的として設計されている。
- SemEval 2026のPOLARデータセットでの実験では、DPOによる洗練によって英語の開発データにおけるリコールが0.5085から0.7797へ向上し、macro-F1も約5ポイント上昇したと報告されている。




