SemEval-2026タスク13におけるmcdok:機械生成コード検出のためのLLM微調整
arXiv cs.LG / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- SemEval-2026タスク13は、多言語の機械生成コードを対象に、二値検出とソース帰属の両方を含む形で取り組む。
- サブタスクとして、どの生成LLMファミリーが作ったコードかの検出、ヒトと機械の共生成コードの特定、出自を隠すための敵対的改変コードの検出などが扱われる。
- 著者らは、機械生成テキスト検出向けの既存手法mdokを機械生成コード向けに調整し、コード理解に適した複数のベースモデルを検討した。
- 提出システムはいずれの3サブタスクでも競争力のある結果を示したが、上位チームとの差は大きく、さらなる改善余地があることが示唆される。



