心理的に強いが計算上は見えにくい：LLMが検出できないソーシャル比較のきっかけを生成する

arXiv cs.CL / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、テキストのみのXiaohongshu（RedNote）投稿が、第一人称の読者視点で上方・下方・中立（または明確でない）な社会的比較を引き起こすかを検出するためのベンチマークXHS-SCoREを提案する。
prompted LLM分類器と教師ありの中国語エンコーダによる実験では、生成の流暢さと検出の信頼性の間に隔たりがあり、プロンプトベース分類では社会的比較の信号が確実に捉えられないことが示される。
prompted LLMは失敗が一貫しており解釈もしやすく、比較を誘発する投稿を中和してしまったり、モデル固有の方向バイアスを示したりする。
制御されたパイロットでは、同一の構成に対するプロンプトベース検出が不安定でも、LLMが生成したXiaohongshu風の投稿が読者の認知する立場や比較に関連する感情を実際に変えうることが示唆される。
本研究は読者に根ざした比較検出のベンチマークに加え、社会的に意味のある関係的手がかりがプロンプトベース推論からどの程度「部分的にしか見えない」かを調べる診断フレームワークを提供する。