生成AIテキストの自動検出: ニューラルモデルの比較フレームワーク

arXiv cs.CL / 2026/3/20

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文はAI生成テキスト検出を分析し、ドメイン横断で急速に普及するLLMの課題に対処する。
4つのニューラル検出器を設計・評価した：多層パーセプトロン、1D-CNN、MobileNetベースのCNN、および Transformer モデル。
検出器は、ZeroGPT、GPTZero、QuillBot、Originality.AI、Sapling、IsGen、Rephrase、Writer などの広く使われているオンラインツールとベンチマークされた。
COLING 多言語データセット（英語およびイタリア語）と、アートとメンタルヘルスに焦点を当てた社内データセットを用いて、言語横断性とドメインの頑健性を評価した。
結果は、教師ありの検出器が商用ツールよりも言語とドメインを跨いでより安定・頑健な性能を示し、検出アプローチの現状の長所と限界を浮き彫りにしている。

要旨：大規模言語モデルの急速な普及は、人が書いたテキストとAIが生成したテキストを識別する難易度を著しく高め、学術、編集、社会領域全体にわたる重大な課題を生じさせています。本論文は、AI生成テキスト検出の問題を、複数の機械学習ベースの検出器の設計・実装・比較評価を通じて調査します。四つのニューラルアーキテクチャを開発・分析します：多層パーセプトロン、1次元畳み込みニューラルネットワーク、MobileNetベースのCNN、そしてトランスフォーマーモデル。提案されたモデルは、ZeroGPT、GPTZero、QuillBot、Originality.AI、Sapling、IsGen、Rephrase、Writer を含む、広く使用されているオンライン検出ツールとベンチマークとして比較されます。 COLING Multilingual Dataset を用いた実験を実施し、英語とイタリア語の設定の両方を検討するとともに、芸術とメンタルヘルスをテーマとしたオリジナルのデータセットにも焦点を当てています。結果は、教師あり検出器が、異なる言語・ドメインにおいて商用ツールよりも安定的で堅牢な性能を達成することを示しており、現在の検出戦略の主要な長所と制限を浮き彫りにしています。

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

機械学習・ディープラーニングにおける数学の必要性

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Santa Augmentcode Intent Ep.6

Dev.to

あなたのエージェントが別のエージェントを雇った。出力はゴミだった。金も消えた。

Dev.to

生成AIテキストの自動検出: ニューラルモデルの比較フレームワーク

要点

関連記事

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

機械学習・ディープラーニングにおける数学の必要性

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

Santa Augmentcode Intent Ep.6

あなたのエージェントが別のエージェントを雇った。出力はゴミだった。金も消えた。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer