PCOSと摂食障害の交差：隠れたトリプル・バーデン検出のための説明可能AIアプローチ

arXiv cs.CL / 2026/4/17

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

この研究は、PCOSの女性が抱える「トリプル・バーデン」（ボディイメージの苦痛、摂食の問題、代謝上の課題）について、ソーシャルメディア上の言語から共存状態を検出する手法を強化することを目的としている。
既存の説明性の乏しいNLP手法に比べ、テキスト根拠（evidence）に基づく、根拠付きの説明を生成するよう小型のオープンソース言語モデルを微調整した。
6つのサブレディットから収集したPCOS関連投稿1,000件を用い、2名のアノテータが臨床フレームワークを運用化したガイドラインでラベル付けし、モデルを評価した。
最良モデルは、複数モデル（Gemma-2-2B、Qwen3-1.7B、DeepSeek-R1-Distill-Qwen-1.5B）の中で、ホールドアウト150件に対して完全一致精度75.3%を達成し、併存（comorbidity）検出と説明可能性が良好だった。
診断の複雑さが増すほど性能が低下したため、自律的な診断よりもスクリーニング用途が適していることを示唆している。

要旨: 多嚢胞性卵巣症候群（PCOS）の女性は、身体イメージの苦痛、摂食の障害、ならびに代謝上の課題に対して、実質的に高いリスクに直面している。しかし、これらの状態を検出するための既存の自然言語処理アプローチは透明性に欠け、併存する症状（co-occurring presentations）を特定できない。私たちは、根拠に基づく説明可能性を備えたソーシャルメディア投稿に対し、この3重の負担（triple burden）を自動的に検出するための、小型でオープンソースの言語モデルを開発した。6つのサブレディットからPCOS関連投稿1,000件を収集し、2名の訓練済みアノテータが、Leeら（2017）の臨床フレームワークを実運用化するガイドラインを用いて投稿にラベル付けを行った。3つのモデル（Gemma-2-2B、Qwen3-1.7B、DeepSeek-R1-Distill-Qwen-1.5B）を、低ランク適応（Low-Rank Adaptation）を用いて微調整し、テキスト上の根拠（textual evidence）に基づく、構造化された説明を生成できるようにした。最良のモデルは、保持した150件の投稿において正確一致（exact match）精度75.3%を達成し、併存疾患の検出が堅牢で、説明可能性も高かった。診断の複雑さが増すにつれて性能は低下したことから、これらのモデルの最適な用途は自律的診断ではなくスクリーニングであることが示唆される。