認知バイアスが絡む中国のショート動画型誤情報に対するマルチモーダル大規模言語モデルの検証
arXiv cs.CL / 2026/5/4
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、認知バイアスと結びついた中国のショート動画型誤情報に対し、マルチモーダル大規模言語モデルがどの程度頑健かを評価する枠組みを提示する。
- 200本のショート動画からなる手作業アノテーション付きデータセットを構築し、4つの健康領域にまたがって、実験エラー・論理の誤謬・捏造された主張の3種類の欺瞞パターンを、国家基準や学術文献といった根拠で検証してラベル付けした。
- 8つの最先端MLLMを5つのモダリティ設定で評価した結果、マルチモーダル環境でGemini-2.5-Proが最高性能(belief score 71.5/100)で、o3が最も低かった(35.2)。
- 誤情報動画に含まれる社会的手がかりを調べたところ、権威的なチャンネルIDのようなバイアスによってモデルが誤った信念を形成しやすいことが示された。



