CNSocialDepress:うつ病リスク検出と構造化解析のための中国のソーシャルメディアデータセット
arXiv cs.CL / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、うつ病リスク検出と分析を目的とした中国語ソーシャルメディアのベンチマークデータセット「CNSocialDepress」を紹介する。
- このデータセットには、233人のユーザーからの44,178件の投稿が含まれており、心理の専門家が10,306のうつ病関連セグメントに注釈を付けている。
- 二値ラベルのみのリソースとは異なり、CNSocialDepressは、解釈可能できめ細かな信号分析のために、二値のリスクラベルに加えて、構造化された多次元の心理的属性も提供する。
- 実験の結果、このデータセットは、構造化された心理プロファイリングやうつ病検出のための大規模言語モデルの微調整など、複数のNLPタスクを支援できることが示された。
- 著者らは、CNSocialDepressを、中国語話者に合わせたメンタルヘルス応用に向けた実用的なリソースとして位置づけ、公的に利用可能なリソースの不足に対処している。



