MALicious INTent Datasetと拡張された偽情報検出のためのLLMsの予防接種

arXiv cs.CL / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

MALINTは、専門家のファクトチェッカーと協力して開発された、ディスインフォメーションと悪意のある意図を捉える最初の人手注釈付き英語コーパスです。
本研究は、BERTのような小型モデルからLlama 3.3のような大規模モデルまで、12の言語モデルを対象に、2値および多ラベルの意図分類タスクでベンチマークを行っています。
意図分析を統合することでディスインフォメーションの説得的影響を緩和するための、意図ベースの接種というLLMs向けの推論アプローチを提案します。
著者らは、意図を組み込んだ推論が、6つのデータセット、5つのLLM、7言語にわたってゼロショットの偽情報検出を改善することを示し、注釈付きのMALINTデータセットを公開しています。

要約: 故意的なデマの創出と拡散は、公共の議論に重大な脅威をもたらします。しかし、既存の英語データセットと研究は、デマの背後にある意図性をほとんど扱いません。この研究は MALINT を提示します。専門家のファクトチェッカーと協力して開発された、デマとその悪意ある意図を捉える初の人手注釈付き英語コーパスです。私たちはこの新規コーパスを用いて、12の言語モデルをベンチマークします。小型言語モデル（SLMs）としての BERT や、Llama 3.3 のような大型言語モデル（LLMs）を含む、二値および多ラベルの意図分類タスクで評価します。さらに、心理学とコミュニケーション研究の接種理論に触発され、悪意ある意図に関する知識を組み込むことがデマ検出を改善できるかどうかを調べます。この目的のため、意図分析を統合してデマの説得的影響を緩和する、LLM 向けの意図強化推論である「意図ベースの接種」を提案します。6つのデマデータセット、5つのLLM、および7言語を用いた分析は、意図を拡張した推論がゼロショットのデマ検出を改善することを示しています。意図認識型デマ検出の研究を支援するため、各注釈ステップからの注釈を含む MALINT データセットを公開します。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

MALicious INTent Datasetと拡張された偽情報検出のためのLLMsの予防接種

要点

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer