arXiv、LLM生成の誤り(ハルシネーション参照など)を含む論文に1年間の出禁を導入

Reddit r/MachineLearning / 2026/5/15

📰 ニュースSignals & Early TrendsIndustry & Market Moves

要点

  • arXivのモデレーターは、LLM生成の結果が十分に検証されていないことを示す「疑いを覆しえない証拠」がある投稿に対して、罰則を明確化しました。
  • 罰則は、該当する論文の投稿者に対するarXivでの1年間の出禁で、その後のarXiv投稿には信頼できる査読付き学術誌での事前受理が必要になります。
  • 「疑いを覆しえない証拠」の例として、存在しない参考文献(ハルシネーション)、LLMによるメタコメント(要約作成の案内や変更提案)、表の数値などを実験結果ではなく例示のままにしているような指示が挙げられています。
  • arXivは、生成AIツールが不適切な表現、剽窃、偏り、誤り、誤った参照、誤解を招く内容を含む出力を作った場合でも、それを科学的成果物に含めた著者側に責任があるという立場を強調しています。

(cs.LGのarXivモデレーター)Thomas G. Dietterichから(スレッド):
https://x.com/tdietterich/status/2055000956144935055
https://xcancel.com/tdietterich/status/2055000956144935055

「arXivの著者の皆さまへ:行動規範では、論文の著者として署名することにより、各著者は、コンテンツがどのように生成されたかに関係なく、その内容すべてについて完全な責任を負うことになっています。

生成的AIツールが不適切な言語、剽窃された内容、偏った内容、誤り、間違い、誤った参照、誤解を招く内容を生成し、その出力が科学的著作物に含まれている場合、その責任は著者(著者たち)にあります。

私たちは最近、この点に関する罰則を明確化しました。投稿物に、著者がLLMによる生成結果を確認していなかったことを裏付ける否定できない証拠が含まれている場合、その論文の内容を信頼できないということになります。

罰則は、arXivから1年間の出禁処分で、その後のarXivへの投稿は、まず信頼できる査読付きの会場で受理される必要があります。

否定できない証拠の例:幻覚のようにでっち上げられた参照、LLMからのメタコメント(「200語の要約を示しました。変更を加えましょうか?」;「この表のデータは例示です。実験で得た実際の数値で埋めてください」)。"

submitted by /u/Nunki08
[link] [comments]