K-SENSE：精神的健康状態のソーシャルメディア上の神経意味評価のための知識ガイド付き自己増強エンコーダ

arXiv cs.CL / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本稿では、比喩的表現や暗黙の感情表出、ユーザー生成コンテンツ特有のノイズを含む状況下でもメンタルヘルス（ストレス・うつ）を検出することを目的にした「K-SENSE」を提案している。
K-SENSEは、外部のコモンセンス／心理的推論（COMETを用い5つのメンタル状態次元に基づいて抽出）と、頑健性を高める手法（3段階のエンコーディング・パイプラインと教師ありコントラスト学習）を統合している。
2つの並列エンコーダストリームにより「セマンティックアンカー」を作り、隠れ表現を共通空間へ射影して融合する構成を取りつつ、学習目的で同クラス表現を整合させ、関連しない知識ノイズを抑制する。
Dreaddit（ストレス）と Depression_Mixed（うつ）での評価では、平均F1がそれぞれ86.1、94.3となり、最強の先行ベースラインに対して約2.6、1.5ポイントの改善が示された。
アブレーション実験から、時間的な知識統合戦略や、微調整時に知識エンコーダを凍結する設計など、各コンポーネントが性能向上に寄与することが確認されている。

概要：ソーシャルメディアのテキストから、特にストレスや抑うつといったメンタルヘルスの状態を早期に検出することは、計算精神医学および自然言語処理における依然として未解決の難題である。自動化システムは、比喩表現、暗黙的な感情の表出、ならびにユーザー生成コンテンツに内在する高いノイズという課題に対処しなければならない。既存の手法は、大きくは、外部の常識知識を活用してメンタル状態を明示的にモデル化するか、あるいは自己拡張と対照学習を適用して汎化性能を向上させるかのいずれかに依存しており、原理的かつ統一された枠組みの中で両者をともに扱うことはまれである。私たちは、K-SENSE（Knowledge-guided Self-augmented Encoder for Neuro-Semantic Evaluation of Mental Health）を提案する。これは、外部の心理的推論と内部表現の頑健性を共同で活用する枠組みである。K-SENSEは三段階のエンコーディング・パイプラインを採用する：（1）推論的常識知識は、COMETモデルから5つのメンタル状態次元にわたって抽出する；（2）意味アンカーは、並列な2つのエンコーディングストリームから得た隠れ表現を結合し、融合の前に共有空間へ射影することで構築する；（3）教師ありコントラスト学習の目的関数により、同一クラスの表現を整列させつつ、注意機構が無関係な知識ノイズを抑制することを促す。私たちは、K-SENSEをDreaddit（ストレス検出）およびDepression_Mixed（抑うつ検出）で評価し、5つの独立した実行にわたって、それぞれ平均F1スコア86.1（0.6%）および94.3（0.8%）を達成した。これは、これまでで最も強力な先行ベースラインに対しておよそ2.6および1.5パーセンテージポイントの改善に相当する。アブレーション実験により、時間的知識統合戦略や、微調整中に知識エンコーダを凍結したままにするという選択を含む、各アーキテクチャ構成要素の寄与が確認される。