RAGognizer:検出ヘッド統合による、幻覚に配慮したファインチューニング
arXiv cs.CL / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、RAG(Retrieval-Augmented Generation)において、幻覚検出を事後的なチェックではなく学習の一部として扱う手法を提案しています。
- 自然に発生したクローズド領域の幻覚を、トークン単位の注釈付きで収録した新しいデータセット(RAGognize)を導入します。
- 軽量な検出ヘッドをLLMに統合し、言語モデリングと幻覚検出を同時に最適化できるようにします。
- 内部表現のうち幻覚に関連するものの識別性を高めることで、トークン単位の検出精度向上と生成中の幻覚率低減の双方を狙います。
- 複数のベンチマークで、トークン単位の幻覚検出において最先端の性能と、言語品質や関連性を損なわない形での幻覚削減が報告されています。



