整合性と強化学習による推論を意識したAIGC検出

arXiv cs.AI / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 論文では、AIGC-text-bankというマルチドメインのデータセットを導入し、多様なLLM出所や著者シナリオにまたがってより堅牢なAI生成テキスト検出を支えることを目指しています。
  • REVEALという検出フレームワークを提案しており、まず解釈可能な推論チェーンを生成してから、その内容に基づいて分類を行います。
  • REVEALは2段階の学習で訓練され、推論能力を形成するための教師あり微調整の後、検出精度の向上・論理的一貫性の改善・幻覚の低減を目的に強化学習を行います。
  • 実験では、REVEALが複数のベンチマークで最先端の性能を達成し、より透明性の高いAIGC検出手法として位置づけられています。
  • プロジェクトは https://aka.ms/reveal でオープンソースとして公開されています。

要旨: 大規模言語モデル(LLM)の急速な進歩と広範な採用により、信頼できるAI生成コンテンツ(AIGC)検出の必要性が高まっている一方で、モデルが進化するにつれて検出は依然として難しいままです。私たちは、さまざまなLLMの出所と著者性のシナリオを含む包括的なマルチドメインデータセット「AIGC-text-bank」を紹介し、分類の前に解釈可能な推論チェーンを生成する検出フレームワーク「REVEAL」を提案します。私たちの手法は2段階の学習戦略を用います。まず、推論能力を確立するための教師あり微調整を行い、その後に強化学習を用いて精度を向上させ、論理的整合性を高め、幻覚を減らします。広範な実験により、REVEALが複数のベンチマークで最先端の性能を達成し、AIGC検出に対して堅牢で透明性の高い解決策を提供することが示されます。このプロジェクトはオープンソースで、https://aka.ms/reveal で公開されています