ダーマ、データ、そして欺瞞:YouTube上の「牛尿の健康効果」主張に対するLLMによる修辞分析

arXiv cs.CL / 2026/4/27

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この研究では、牛尿(ゴームトラ)を健康療法として宣伝する/否定するYouTubeの発話を書き起こし100本を分析し、文化的伝統と科学的に聞こえる誤情報が交差する様子を明らかにします。
  • 複数のLLM(GPT-4系、Gemini 2.5 Pro、Mistral Medium 3など)を用いて、権威への訴え、有効性の訴え、陰謀論的な枠組みといった説得手法を14カテゴリの分類法で注釈付けします。
  • 結果として、主張の推進側は有効性訴求や社会的証明に強く依存するのに対し、否定側は権威づけや反論をより多く用いることが示されます。
  • 注釈の一部について人手評価を行ったところ、アノテータ間一致率が90.1%となり、分類法と検証手順の信頼性が裏付けられました。
  • 本研究は、誤情報を大規模に分析する計算手法の発展に寄与し、オンライン上の文化的言説の力学を地図化する手段としてLLMが有効であることを示しています。

要旨: 健康に関する誤情報は、特に文化的伝統が科学的に聞こえる主張と交差するとき、ソーシャルメディア上で最も差し迫った課題の1つであり続けています。これらのダイナミクスは世界的なものにとどまらず、きわめて地域に根差した形でも現れ、慎重な分析を要する文化固有の論争として表面化します。そこで本研究では、ガンムートラ(牛の尿)を健康上の治療法として宣伝または否定する100本のYouTubeトランスクリプトを対象に、権威への訴え、有効性への訴え、陰謀論的な枠組み付けといった修辞戦略に焦点を当てて検討します。GPT-4、GPT-4o、GPT-4.1、GPT-5、Gemini 2.5 Pro、Mistral Medium 3を含む大規模言語モデル(LLM)を用い、説得戦術の14カテゴリの分類法(タクソノミー)に基づいてトランスクリプトに注釈を付与します。分析の結果、宣伝者は主として有効性への訴えとソーシャルプルーフに依存しているのに対し、否定者は権威を強調し、反論に重きを置いていることが明らかになりました。注釈の一部に対する人手評価では、注釈者間一致率が90.1\%となり、分類法と検証プロセスの信頼性が確認されました。本研究は、誤情報分析のための計算手法を前進させるとともに、LLMがオンライン上の文化的言説の大規模研究をどのように支え得るかを示します。