引用根拠づけ:法的引用グラフによってLLMの引用ハルシネーションを検出・低減する
arXiv cs.CL / 2026/6/2
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research
要点
- 本論文は、「引用根拠づけ(citation grounding: CG)」として、100.8百万件のウクライナの裁判例から抽出した真の法的引用グラフに基づき、LLMが生成した法令引用が裏付けられているかを検証する指標を提案しています。
- CGは、精度(引用された条文が存在するか)、妥当性(文脈的に適切か)、時点妥当性(問題となった時期に有効だったか)の3側面で評価し、ハルシネーションの種類を切り分け可能にします。
- ウクライナの法的クエリ100件に対して、5つのLLM(AWS Bedrock経由の4商用システムとRAG運用システム1つ)を評価した結果、CGスコアは0.791〜0.873で、引用の13〜21%がハルシネーションでした。
- 人手による注釈なしでハルシネーションを減らすために、「Citation Grounding DPO(CG-DPO)」として、実際の裁判例の検証済み引用を狙いをもって改変して嗜好ペアを自動生成し、それに基づいて学習する手法を導入しています。
- 裁判引用グラフ、評価フレームワーク、CG-DPO用データセットがオープンリソースとして公開され、今後の研究・ベンチマークに利用できます。
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



