なぜ私たちは孤独なのか? LLMを活用して介護者と非介護者における孤独を測定し理解する

arXiv cs.CL / 2026/4/10

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、専門家が開発した評価フレームワークおよび孤独の原因の類型(タイポロジー)を用いて、介護者と非介護者の孤独を測定するための多様なソーシャルメディア・データセットを構築しラベル付けする、LLM駆動のパイプラインを提案する。
  • GPT-4o、GPT-5-nano、GPT-5 という複数のLLMを適用し、人間による検証済みのデータ処理ワークフローによって、分析に用いる高品質なRedditコーパスを構築する。
  • 孤独の分類器は、介護者で平均76.09%、非介護者で平均79.78%の精度を達成しており、集団をまたいだ比較的強い性能が示される。
  • 原因のカテゴリ分けコンポーネントは、介護者でマイクロ平均のF1スコア0.825、非介護者で0.80に到達し、集団間で最も異なる背景要因を分析できるようにする。
  • 結果は、介護者の孤独が、介護という役割、アイデンティティの認知、そして見捨てられたように感じることと結び付く割合がより高いことを示しており、人口統計情報の抽出によって、Redditが多様な介護者向けの孤独データセットの情報源として有効であることが裏付けられる。

Abstract

本論文は、介護者集団および非介護者集団における孤独感を測定し比較するために、多様なソーシャルメディアデータセットを構築するLLM駆動型のアプローチを提示する。専門家が開発した孤独感評価フレームワークと、ソーシャルメディア文の分析のために孤独感の原因を分類するための専門家により情報提供された類型(typology)を導入する。人手によって検証されたデータ処理パイプラインを用いて、GPT-4o、GPT-5-nano、GPT-5を適用し、高品質なRedditコーパスを構築し、両集団にまたがって孤独感を分析する。孤独感評価フレームワークは、介護者に対して平均76.09%、非介護者に対して平均79.78%の精度を達成した。原因のカテゴリ分類フレームワークは、介護者に対してマイクロ平均の集計F1スコアが0.825、非介護者に対して0.80を達成した。集団間で、孤独感の原因のタイプの分布には顕著な相違が見られる。介護者の孤独感は主に、介護の役割、アイデンティティの認知、そして見捨てられたと感じることに結び付いており、両集団の間で異なる孤独体験が示唆される。さらに、人口統計情報の抽出により、Redditが多様な介護者の孤独感データセットを構築するのに適していることが示される。総じて本研究は、孤独感の研究のために高品質なソーシャルメディアデータセットを作成するLLMベースのパイプラインを確立し、孤独感の現れにおける集団レベルの差異を分析するうえでその有効性を実証する。