プロンプト誘導による抑うつ症状のエビデンス学習

arXiv cs.CL / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、抑うつの21症状について、ソーシャルメディア等のユーザー生成テキスト内で症状に関する「エビデンス」を自動的に見つけ、臨床サービスの限られたキャパシティを補完し大規模化することを目的としています。
BDI-IIに基づいて症状の関連性を注釈した、文レベルのデータセット「BDI-Sen」を提示し、このタスクがきめ細かくかつ極めて不均衡であることを示しています。
著者らは、ゼロショット、インコンテキスト学習、微調整といった一般的なLLM手法では、多くの症状に対して関連基準を一貫させるのが難しいと報告しています。
そこで、Symptom Induction（SI）を提案し、ラベル付き例を短く解釈可能な症状別ガイドラインに圧縮して、それを分類の条件付けに用いる仕組みを示します。
複数のLLMファミリーとモデルにわたって、SIはBDI-Senでの加重F1を改善し、さらに双極性障害や摂食障害など症状が重なる他疾患にもガイドラインが一般化することを確認しています。

Abstract

抑うつはメンタルヘルスサービスに大きな負担を与えており、多くの人が高いボリュームのユーザー生成テキスト（例：オンラインフォーラムやソーシャルメディア）内で、自身の臨床現場外での経験を語っています。そのようなテキスト中で臨床的な症状のエビデンスを自動的に特定することは、限られた臨床的な受け入れ能力を補完し、大規模な人口にスケールするうえで有益です。私たちは、このニーズに対して、BDI-II質問票から21の抑うつ症状を文レベルで分類することで取り組みます。具体的には、症状の関連性について注釈が付けられたデータセットであるBDI-Senを用います。この課題はきめ細かく、かつクラスの偏りが非常に大きいのですが、一般的なLLMアプローチ（ゼロショット、インコンテキスト学習、ファインチューニング）では、大部分の症状に対して一貫した関連性の基準を適用することが難しいことが分かりました。私たちはSymptom Induction（SI）という新しいアプローチを提案します。SIは、ラベル付けされた例を短くて解釈可能なガイドラインへと圧縮し、各症状に対して何がエビデンスに当たるのかを明示します。そして、このガイドラインを用いて分類を条件付けます。4つのLLMファミリーと8つのモデルにわたる実験の結果、SIはBDI-Senにおいて全体として最良の加重F1を達成し、とりわけ頻度の低い症状で大きな改善が見られました。さらに、外部データセットによるドメインをまたいだ評価では、誘導されたガイドラインが、共有する症状性を持つ他の疾患（双極性障害および摂食障害）にわたって一般化することも示されました。