Legal-DC: 法的文書に対する Retrieval-Augmented Generation（RAG）のベンチマーク

arXiv cs.CL / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、中国語の法的RAGベンチマークLegal-DCを紹介します。480件の法的文書と、条項レベルの参照が注釈された2,475の精緻化されたQ&Aペアを含み、中国語の法的検索と生成の専門的評価を可能にします。
LegRAGフレームワークを提示します。条項境界のセグメンテーションと二重経路の自己反省機構を組み合わせ、条項の完全性を維持しつつ回答の正確さを向上させます。
大規模言語モデルにおける高信頼性の法的検索シナリオ向けに特化した自動評価手法を提案します。
LegRAGは、主要指標において既存の最先端手法を1.3%〜5.6%上回ります。著者はコミュニティ利用のためにGitHubでコードとデータを公開しています。

要旨: Retrieval-Augmented Generation（RAG）は法的文書の照会に有望な技術として浮上しています。しかし中国語の法的シナリオへの適用には2つの重要な制約があります。既存のベンチマークにはリトリーバーとジェネレーターの共同評価を専門的にサポートする機能が欠けており、主流のRAGシステムは法的条項の構造化された性質を適切に取り入れることが難しいという点です。これらのギャップを埋めるべく、本研究は2つの中核的貢献を推進します。第一に、Legal-DCベンチマークデータセットを構築しました。480の法的文書（市場規制や契約管理などを含む）と、条項レベルの参照が注釈された2,475の精緻化されたQ&Aペアから成り、中国語の法的RAGにおける専門的評価資源のギャップを埋めます。第二に、LegRAGフレームワークを提案します。条項境界のセグメンテーションを含む法的適応型インデックス作成と、条項の完全性を保証しつつ回答の正確性を高める二重経路の自己反省機構を統合します。第三に、法的検索シナリオの高信頼性要件を満たす大規模言語モデル用の自動評価手法を導入します。LegRAGは、主要評価指標において既存の最先端手法を1.3%〜5.6%上回ります。本研究は、中国語法的RAGシステムの開発を進めるための特化型ベンチマーク、実践的フレームワーク、および実証的洞察を提供します。コードとデータは https://github.com/legal-dc/Legal-DC に公開されています。

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

日経XTECH

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

日経XTECH

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

日経XTECH

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

Legal-DC: 法的文書に対する Retrieval-Augmented Generation（RAG）のベンチマーク

要点

関連記事

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

中国AI企業が他社製AIを「ただ乗り蒸留」か 米社が主張、安全保障リスクも

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも