HalluCiteChecker:AIサイエンティスト時代における「幻覚的引用」の検出と検証のための軽量ツールキット

arXiv cs.CL / 2026/4/30

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • HalluCiteCheckerは、既存の文献に対応しない「幻覚的な引用」を検出・検証することを目的とした、軽量なツールキットです。
  • 著者らは、幻覚的引用の検出をNLPタスクとして定式化し、その解決に向けた実用的な土台としてツールキットを提供しています。
  • このパッケージは標準的なノートPCで数秒で検証でき、完全にオフラインで動作し、CPUのみで効率よく実行できるとされています。
  • 査読者や著者の手作業による負担を減らし、プレレビューや出版前チェックを体系的に行えるようにすることを狙っています。
  • コードはApache 2.0でGitHubに公開され、PyPI経由でインストール可能な形で配布されており、YouTubeでデモ動画も提供されています。

Abstract

本研究では、科学論文における幻覚的な引用(ハルシネーテッド・シテーション)を検出し、検証するためのツールキット「HalluCiteChecker」を紹介します。AIアシスタント技術は、引用の推薦を含め、学術論文の執筆プロセスを大きく変えましたが、その一方で、既存のいかなる研究とも対応しない幻覚的な引用の出現も招いています。このような引用は、科学論文の信頼性を損なうだけでなく、査読プロセスの間にその妥当性を手作業で確認しなければならない査読者や著者に対して、追加の負担を課します。本研究では、幻覚的な引用の検出をNLP(自然言語処理)のタスクとして形式化し、この問題に対処するための実践的な基盤として対応するツールキットを提供します。私たちのパッケージは軽量であり、一般的なラップトップ上で数秒で検証を実行できます。また、完全にオフラインで実行することも可能で、CPUのみを用いて効率よく動作します。HalluCiteCheckerが、組織者による組織的な事前査読および出版前チェックを可能にすることで、査読者の負担を軽減し、支援することを期待しています。コードはGitHub上でApache 2.0ライセンスのもと公開しており、PyPIを通じてインストール可能なパッケージとして配布しています。デモ動画はYouTubeで視聴できます。