大規模言語モデルによるソーシャルメディアでの抑うつリスク評価

arXiv cs.CL / 2026/4/23

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、8つの抑うつ関連感情をマルチラベル分類し、重み付き重症度インデックスを算出することで、Reddit投稿における抑うつリスクをLLMで評価するシステムを提案している。
  • DepressionEmoデータセット(約6,000投稿)でゼロショット評価を行ったうえで、2024〜2025年に収集した4つのサブレディットから469,692件のコメントに対して実環境適用している。
  • 最良モデルのgemma3:27bは、micro-F1=0.75、macro-F1=0.70を達成し、BARTなどの専用に微調整された手法(micro-F1=0.80、macro-F1=0.76)と競争力のある性能を示した。
  • 実環境での分析では、コミュニティ間でリスクプロファイルが時間的に安定していること、特にr/depressionとr/anxietyで明確な違いが見られることが報告されている。
  • 著者らは、ソーシャルメディアの言語信号を用いることで、心理的モニタリングをコスト効率よく大規模化できる可能性を示している。

要旨: 躁うつ(depression)は、世界中で最も広く見られ、かつ深刻な負担をもたらす精神疾患の1つであり、しばしば十分に診断されず、十分に治療されていません。ソーシャルメディア・プラットフォームの拡大は、心理的ウェルビーイングの自動モニタリングのための、自然な言語的シグナルに富んだ情報源を提供します。本研究では、8つの躁うつ(うつ)関連の感情に対するマルチラベル分類と、重み付き重症度指標の算出を通じて、Reddit投稿における躁うつリスク評価のための、大規模言語モデル(LLM)に基づくシステムを提案します。この手法は、注釈付きのDepressionEmoデータセット(約6,000投稿)においてゼロショット設定で評価され、さらに2024〜2025年の期間に4つのサブレディットから収集した469,692件のコメントに対して、野外(in-the-wild)で適用されました。私たちの最良モデルであるgemma3:27bは、micro-F1 = 0.75、macro-F1 = 0.70を達成しており、目的に合わせて微調整したモデル(BART: micro-F1 = 0.80、macro-F1 = 0.76)と競争力のある結果を示します。野外での分析では、コミュニティ間でリスク・プロファイルが一貫しており、かつ時間的に安定していることが明らかになり、r/depressionとr/anxietyの間には顕著な違いが見られました。以上の結果は、大規模な心理モニタリングに向けた、費用対効果の高いスケーラブルなアプローチの実現可能性を示しています。