人間 vs. 機械による欺瞞:アンサンブル学習でAI生成と人手による偽ニュースを見分ける
arXiv cs.CL / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、AI生成の偽ニュースが人間による誤情報とどのように異なるかを、言語的・構造的・感情的な手がかりに注目して検討する。
- 文の構造、語彙の多様性、句読点のパターン、可読性指標、感情に関する測定(例:恐怖、怒り、信頼、期待)を用いて、文書レベルの特徴量を構築する。
- 複数の分類器(ロジスティック回帰、ランダムフォレスト、SVM、XGBoost、ニューラルネットワーク)を比較し、評価には正確度(accuracy)とROC-AUCを用いる。
- 結果として、可読性ベースの特徴量が最も有益な予測因子であり、AI生成テキストはより均一な文体パターンを示す傾向があることが示される。
- モデル予測を集約するアンサンブル手法は、個々のモデルよりも控えめだが一貫した性能向上をもたらし、テキストの特性によって頑健に識別できる可能性を示唆する。



