生成AIテキストの自動検出: ニューラルモデルの比較フレームワーク

arXiv cs.CL / 2026/3/20

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文はAI生成テキスト検出を分析し、ドメイン横断で急速に普及するLLMの課題に対処する。
  • 4つのニューラル検出器を設計・評価した:多層パーセプトロン、1D-CNN、MobileNetベースのCNN、および Transformer モデル。
  • 検出器は、ZeroGPT、GPTZero、QuillBot、Originality.AI、Sapling、IsGen、Rephrase、Writer などの広く使われているオンラインツールとベンチマークされた。
  • COLING 多言語データセット(英語およびイタリア語)と、アートとメンタルヘルスに焦点を当てた社内データセットを用いて、言語横断性とドメインの頑健性を評価した。
  • 結果は、教師ありの検出器が商用ツールよりも言語とドメインを跨いでより安定・頑健な性能を示し、検出アプローチの現状の長所と限界を浮き彫りにしている。

要旨: 大規模言語モデルの急速な普及は、人が書いたテキストとAIが生成したテキストを識別する難易度を著しく高め、学術、編集、社会領域全体にわたる重大な課題を生じさせています。 本論文は、AI生成テキスト検出の問題を、複数の機械学習ベースの検出器の設計・実装・比較評価を通じて調査します。 四つのニューラルアーキテクチャを開発・分析します:多層パーセプトロン、1次元畳み込みニューラルネットワーク、MobileNetベースのCNN、そしてトランスフォーマーモデル。 提案されたモデルは、ZeroGPT、GPTZero、QuillBot、Originality.AI、Sapling、IsGen、Rephrase、Writer を含む、広く使用されているオンライン検出ツールとベンチマークとして比較されます。 COLING Multilingual Dataset を用いた実験を実施し、英語とイタリア語の設定の両方を検討するとともに、芸術とメンタルヘルスをテーマとしたオリジナルのデータセットにも焦点を当てています。 結果は、教師あり検出器が、異なる言語・ドメインにおいて商用ツールよりも安定的で堅牢な性能を達成することを示しており、現在の検出戦略の主要な長所と制限を浮き彫りにしています。