要旨: 急速に広がるオンラインプラットフォーム上の誤情報は、堅牢で最新かつ説明可能で多言語対応の事実検証リソースの緊急な必要性を強調しています。しかし、既存のデータセットは範囲が限定的で、多くの場合、マルチモーダル証拠、構造化された注釈、主張・証拠・判定間の詳細なリンクが欠けています。本論文は、ClaimReviewフィードを集約し、完全な検証記事をスクレイピングし、異種の主張判定を正規化し、構造化されたメタデータと整合する視覚コンテンツを付加して拡充する、フランス語およびドイツ語のマルチモーダル事実検証データセットを構築するデータ収集・処理パイプラインを紹介します。私たちは、先端の大規模言語モデル(LLMs)およびマルチモーダルLLMsを、(i)事前に定義された証拠カテゴリの下での証拠抽出、(ii)証拠を判定へ結びつける根拠の生成に使用しました。G-Evalによる評価と人間の評価は、我々のパイプラインが異なる組織やメディア市場間での事実検証の実践を細分化して比較できること、より解釈しやすく、証拠に基づく事実検証モデルの開発を促進できること、そして多言語・マルチモーダルな誤情報検証に関する今後の研究の基盤を築くことを示しています。
信頼性が高く構造化されたファクトチェック済み主張データセットを作成するための多言語・マルチモーダル・パイプライン
arXiv cs.CL / 2026/3/16
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この研究は、ClaimReviewフィードを集約し、検証記事をスクレイピングすることで、フランス語とドイツ語のファクトチェックデータセットを構築する多言語・マルチモーダルなパイプラインを紹介します。
- 最先端の大規模言語モデル(LLMs)およびマルチモーダルLLMsを、証拠の抽出と正当化生成に用い、証拠を判定へ結びつけます。
- パイプラインは、さまざまな判定を正規化し、構造化メタデータと整合した視覚コンテンツをデータに付加することで、組織横断の分析を支援します。
- G-Evalと人間の評価を用いた評価は、解釈可能でエビデンスに基づくファクトチェックモデルを実現し、異なるメディア市場間の実践をベンチマークできる可能性を示しています。
