人間 vs. 機械による欺瞞:アンサンブル学習でAI生成と人手による偽ニュースを見分ける

arXiv cs.CL / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、AI生成の偽ニュースが人間による誤情報とどのように異なるかを、言語的・構造的・感情的な手がかりに注目して検討する。
  • 文の構造、語彙の多様性、句読点のパターン、可読性指標、感情に関する測定(例:恐怖、怒り、信頼、期待)を用いて、文書レベルの特徴量を構築する。
  • 複数の分類器(ロジスティック回帰、ランダムフォレスト、SVM、XGBoost、ニューラルネットワーク)を比較し、評価には正確度(accuracy)とROC-AUCを用いる。
  • 結果として、可読性ベースの特徴量が最も有益な予測因子であり、AI生成テキストはより均一な文体パターンを示す傾向があることが示される。
  • モデル予測を集約するアンサンブル手法は、個々のモデルよりも控えめだが一貫した性能向上をもたらし、テキストの特性によって頑健に識別できる可能性を示唆する。

Abstract

大規模言語モデルの急速な普及は、従来から存在する人間が書いた誤情報と共存する、新たなクラスのAI生成によるフェイクニュースを生み出しました。これにより、これら2種類の欺瞞的コンテンツがどのように異なるのか、またどれほど信頼性をもって見分けられるのか、という重要な問いが提起されています。本研究では、人間が書いたフェイクニュースとAI生成によるフェイクニュースの間に存在する言語的・構造的・感情的な違いを調べ、これらのコンテンツタイプを識別するための機械学習およびアンサンブルベースの手法を評価します。文の構造、語彙の多様性、句読点パターン、可読性指標、恐怖・怒り・喜び・悲しみ・信頼・期待といった恐ろしく具体的な情動次元を捉える感情ベースの特徴を用いて、文書レベルの特徴表現を構築します。ロジスティック回帰、ランダムフォレスト、サポートベクターマシン、極端勾配ブースティング、ニューラルネットワークを含む複数の分類モデルを適用し、モデル間の予測を集約するアンサンブル枠組みも併用します。モデルの性能は、正確度および受信者操作特性曲線(ROC曲線)下面積を用いて評価します。その結果、分類性能は強く一貫しており、可読性に基づく特徴が最も有益な予測因子として現れ、AI生成テキストはより一様な文体パターンを示すことが分かりました。アンサンブル学習は、個々のモデルに比べて控えめではあるものの一貫した改善をもたらします。これらの知見は、テキストの文体的および構造的な特性が、AI生成による誤情報と人間が書いたフェイクニュースを区別するための堅牢な基盤を提供することを示しています。