TAB-AUDIT: マルチビュー尤度不一致によるAI生成の科学表の検出

arXiv cs.CL / 2026/3/23

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文 TAB-AUDIT は、経験的自然言語処理論文におけるAI生成による偽造科学表の検出を調査し、1,173件のAI生成論文と1,215件の人間著者論文を含む FabTab ベンチマークを提案する。
  • 識別に有用な特徴を特定し、特に表内の不一致(表のスケルトンと数値内容の間に生じるパープレキシティのギャップ)を捉えることが偽造表を区別する鍵となる。
  • これらの特徴を用いたランダムフォレストモデルは従来法を著しく上回り、ドメイン内で0.987 AUROC、ドメイン外で0.883 AUROCを達成した。
  • この知見は、実験用の表をAI生成による科学的不正を検出する重要な鑑識的手掛かりとして位置づけ、将来の研究に向けて新たなベンチマークを確立する。

要旨: AI生成による偽造科学論文は、学術的誠実性の大規模な侵害に対する懸念を高めています。本研究では、表の情報が主張の重要な証拠となるため、実証的NLP論文におけるAI生成の偽造表を検出するための最初の体系的研究を提示します。私たちはFabTabを構築します。表を含む偽造論文の最初のベンチマークデータセットで、実証的NLPにおけるAI生成論文が1,173件、人工著者によるものが1,215件を含みます。包括的な分析を通じて、偽造テーブルと実在のテーブルの体系的な差異を特定し、それらをTAB-AUDITフレームワーク内の識別的特徴のセットとして具体化します。主要な特徴である「表内不一致」は、表のスケルトンと数値内容との困惑度のギャップを捉えます。実験結果は、これらの特徴に基づいて構築されたRandomForestが従来の最先端手法を大幅に上回り、ドメイン内で0.987 AUROC、ドメイン外で0.883 AUROCを達成することを示しています。我々の知見は、実験用の表をAI生成による科学的不正を検出するための重要な法医学的信号として強調し、将来の研究の新しいベンチマークを提供します。