要旨: 世界人口の半数以上が、限られた法的資源のために、市民の司法ニーズを満たすことに苦労しています。大規模言語モデル(LLM)は印象的な推論能力を示している一方で、法的争点の識別という基礎的な段階においても、依然として大きな課題が残されています。このタスクにおけるLLMの能力を調査するために、我々は実世界のマレーシア契約法の裁判事例769件からデータセットを構築しました。GPT-4oを用いて事実を抽出し、候補となる法的争点を生成し、上級の法務専門家がそれに注釈を付与しました。その結果、決定的な制約が明らかになりました。すなわち、LLMは多様な争点候補を生成するものの、その精度が不十分であることです(GPT-4oは62%しか達成できません)。このギャップに対処するために、我々はLePREC(Legal Professional-inspired Reasoning Elicitation and Classification)を提案します。これは、ニューラル生成と構造化された統計的推論を組み合わせるニューロ・シンボリック(神経記号)フレームワークです。LePRECは次の2つから成ります。(1)ニューラル成分はLLMを活用して法的記述を、さまざまな分析上の要因を表す質問-回答ペアへと変換し、(2)シンボリック成分はこれらの離散的特徴に対して疎な線形モデルを適用します。最も情報量の多い推論要因を特定する、明示的な代数的重みを学習します。エンドツーエンドのニューラル手法とは異なり、LePRECは特徴への重み付けを透明化することで解釈可能性を実現しつつ、相関ベースの統計的分類によりデータ効率も維持します。実験では、GPT-4oやClaudeを含む高度なLLMベースラインに比べて30〜40%の改善が示されました。相関ベースの要因-争点分析が、妥当性(関連性)の判断に対してよりデータ効率の高い解決策を提供することが確認されました。
LePREC:構造化された要因にもとづく分類としての推論による法的争点の関連性評価
arXiv cs.CL / 2026/4/22
📰 ニュースModels & Research
要点
- LePRECは、法的争点の特定を「関連性の評価問題」として扱い、改善を目指すニューラル・シンボリック(神経記号)フレームワークとして提案される。
- マレーシアの契約法に関する実在の裁判事例769件から構築したデータセット(GPT-4oで事実抽出と争点候補生成、上級法曹が注釈)を用いた結果、LLMが生成する争点候補の精度は62%にとどまり、法的争点の同定が大きなボトルネックになっていることが示される。
- LePRECは、法文を多様な分析要因を表す質問–回答ペアへ変換するLLMのニューラル要素と、離散特徴に対してスパース線形モデルを適用して解釈可能な代数的重みを学習するシンボリック要素を組み合わせる。
- 実験ではGPT-4oやClaudeなどの強力なLLMベースラインに対して30〜40%の改善が報告され、争点関連性の判断には「要因と争点の相関にもとづく分析」がよりデータ効率の高い解になり得ることが示唆される。



