AI Navigate

大規模言語モデルはソーシャルメディア上のオピオイド関連スラングの意味の曖昧さを解消できる

arXiv cs.CL / 2026/3/12

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、最先端の大規模言語モデル4つ(GPT-4、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5)を、オピオイド関連ソーシャルメディア投稿のスラング曖昧性を解消する3つのタスクで評価した。
  • 3つのタスクを定義する: 語彙表ベースの投稿内の特定語の意味を曖昧さを解消する設定、語彙表なしのオピオイド関連コンテンツを文脈から検出する設定、新興スラングを模擬した設定。
  • タスク全体を通じて、LLMは語彙ベースのベースラインを上回り、「fenty」サブタスクのF1は約0.824-0.972、「smack」サブタスクは約0.540-0.862、語彙表なしF1は約0.544-0.769であり、新興スラング指標もLLMに有利であった(平均正解率0.784、F1 0.712、適合率0.981、再現率0.587)。
  • 著者らは、LLMは低出現性トピックの関連コンテンツを識別できると結論づけ、下流の分析やオピオイド危機監視の予測モデルにおけるデータ品質を向上させると述べている。

要旨: ソーシャルメディアのテキストはオピオイド過量危機の動向を監視する可能性を示している。しかし、ソーシャルメディアのテキストの圧倒的多数はオピオイドとは無関係である。進行中のオピオイド過量危機の動向を監視する際、関連コンテンツを特定する一般的な戦略は、オピオイド関連語の語彙を包含基準として用いることである。しかし、多くのオピオイド用語のスラング、例えば「smack」や「blues」は非オピオイド的意味を共有するため、曖昧である。大規模言語モデル(LLMs)の高度なテキスト推論能力は、これらのスラングの意味を大規模に曖昧さを解消する機会を提供する。我々は、4つの最先端LLM(GPT-4、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5)を評価する3つのタスクを提示する: 辞書ベースの設定(LLMが特定の語の意味を投稿の文脈内で曖昧さを解消する)、語彙表なし設定(LLMが辞書を使わず文脈からオピオイド関連投稿を識別する)、模擬的な新スラング語を用いた新興スラング設定(LLMがオピオイド関連投稿を識別する)。4つのLLMはいずれのタスクでも卓越した性能を示した。辞書ベース設定の2つのサブタスクでは、LLMのF1スコア(「fenty」サブタスク: 0.824-0.972、「smack」サブタスク: 0.540-0.862)は、最良の語彙戦略(0.126および0.009)を大幅に上回った。語彙表なしタスクでは、LLMのF1スコア(0.544-0.769)は語彙戦略の0.080-0.540を上回り、LLMsは一様に再現率が高かった。新興スラングでは、全LLMが平均正解率0.784、F1 0.712、適合率0.981、再現率0.587で、2つの語彙に比べて高かった。我々の結果は、LLMsが低出現性トピックの関連コンテンツを識別するために用いられることを示し、オピオイド関連の言及に限らず、下流の分析や予測モデルに提供されるデータの質を向上させる。