信頼性が高く構造化されたファクトチェック済み主張データセットを作成するための多言語・マルチモーダル・パイプライン

arXiv cs.CL / 2026/3/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

この研究は、ClaimReviewフィードを集約し、検証記事をスクレイピングすることで、フランス語とドイツ語のファクトチェックデータセットを構築する多言語・マルチモーダルなパイプラインを紹介します。
最先端の大規模言語モデル（LLMs）およびマルチモーダルLLMsを、証拠の抽出と正当化生成に用い、証拠を判定へ結びつけます。
パイプラインは、さまざまな判定を正規化し、構造化メタデータと整合した視覚コンテンツをデータに付加することで、組織横断の分析を支援します。
G-Evalと人間の評価を用いた評価は、解釈可能でエビデンスに基づくファクトチェックモデルを実現し、異なるメディア市場間の実践をベンチマークできる可能性を示しています。

要旨: 急速に広がるオンラインプラットフォーム上の誤情報は、堅牢で最新かつ説明可能で多言語対応の事実検証リソースの緊急な必要性を強調しています。しかし、既存のデータセットは範囲が限定的で、多くの場合、マルチモーダル証拠、構造化された注釈、主張・証拠・判定間の詳細なリンクが欠けています。本論文は、ClaimReviewフィードを集約し、完全な検証記事をスクレイピングし、異種の主張判定を正規化し、構造化されたメタデータと整合する視覚コンテンツを付加して拡充する、フランス語およびドイツ語のマルチモーダル事実検証データセットを構築するデータ収集・処理パイプラインを紹介します。私たちは、先端の大規模言語モデル（LLMs）およびマルチモーダルLLMsを、（i）事前に定義された証拠カテゴリの下での証拠抽出、（ii）証拠を判定へ結びつける根拠の生成に使用しました。G-Evalによる評価と人間の評価は、我々のパイプラインが異なる組織やメディア市場間での事実検証の実践を細分化して比較できること、より解釈しやすく、証拠に基づく事実検証モデルの開発を促進できること、そして多言語・マルチモーダルな誤情報検証に関する今後の研究の基盤を築くことを示しています。

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

成長を生み出すCRM開発

Dev.to

カーパシーのオートリサーチ：エージェント型コーディングスキルの向上

Dev.to

API vs Local LLM、まだ感覚で選んでないか？

Qiita

実際に機能するAIプロンプトの書き方

Dev.to

信頼性が高く構造化されたファクトチェック済み主張データセットを作成するための多言語・マルチモーダル・パイプライン

要点

関連記事

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

成長を生み出すCRM開発

カーパシーのオートリサーチ：エージェント型コーディングスキルの向上

API vs Local LLM、まだ感覚で選んでないか？

実際に機能するAIプロンプトの書き方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer