EnsemJudge:多様なモデルアンサンブルによる中国LLM生成テキスト検出の信頼性向上
arXiv cs.CL / 2026/3/31
📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、ドメイン外入力や敵対的入力といった現実の条件下で、中国LLM生成テキストを検出するための堅牢な枠組みであるEnsemJudgeを提案する。
- それぞれに適した戦略に加えて、多様なモデル構成要素にまたがるアンサンブル投票を活用することで、単一モデル手法を超えて検出の信頼性を高める。
- 著者らは、NLPCC2025 Shared Task 1の中国語データセットを用いてEnsemJudgeを訓練・評価し、先行研究の多くが主に英語に焦点を当てていたというギャップに取り組む。
- 本システムはベースライン手法を上回り、タスクで1位を獲得したと報告されており、中国語テキスト検出に対する高い有効性が示される。
- コードは公開されており、他の研究者や実務者がこの手法を再現し、発展させることを可能にする。



