ViLegalNLI：ベトナムの法的テキストに対する自然言語推論

arXiv cs.AI / 2026/5/4

💬 オピニオンDeveloper Stack & InfrastructureModels & Research

共有:

要点

この論文では、ベトナム語の自然言語推論（NLI）を法領域に特化して扱う大規模データセット「ViLegalNLI」を紹介し、公式な法令文書から作成した前提–仮説ペアに「含意」対「非含意」の二値ラベルを付与しています。
ViLegalNLIは、複数の法分野をカバーし、条件節や構造化された論理、領域特有の用語といった現実的な法的推論の特徴を反映した42,012件の前提–仮説ペアで構成されています。
著者らは、制御された仮説生成に大規模言語モデルを活用し、品質検証、アーティファクト抑制、クロスモデル検証を組み込むことで、アノテーションの信頼性と法的整合性を高めるセミオートマティックな構築手法を提案しています。
多言語モデル、ベトナム語特化の事前学習済み言語モデル、指示チューニング済みLLMでの実験では、few-shotのLLM設定が一貫して高い性能を示し、精度は仮説の長さ、語彙の重なり、推論の複雑さに強く影響されることが示されています。
分野をまたいだ評価では、法領域の異なるフィールド間での推論一般化が難しいことが明らかになり、このデータセットは法的推論や信頼できるAIによる法的分析・意思決定支援の今後の研究を後押しするため、研究目的で公開されます。

概要: 本稿では、法領域に特化して構築された、最初の大規模ベトナム語自然言語推論（NLI）データセットであるViLegalNLIを紹介します。データセットは、公式の成文法文書から導出された42,012件の前提—仮説ペアで構成されており、二値の推論ラベル（含意／非含意）で注釈付けされています。これは複数の法領域をカバーし、構造化された論理、条件節、そして領域固有の用語によって特徴づけられる、現実的な法的推論シナリオを反映しています。ViLegalNLIを構築するために、制御された仮説生成のための大規模言語モデルと、体系的な品質検証手順を統合する、半自動データ生成フレームワークを提案します。このフレームワークには、アーティファクトの低減戦略と、クロスモデル検証を組み込み、注釈の信頼性を高め、法的整合性を確保します。得られたデータセットは、言い換え、論理的含意、そして法的に無効な推論を含む多様な推論パターンを捉えており、ベトナム語の法的推論タスクに対する包括的なベンチマークを提供します。多言語モデル、ベトナム語特化の事前学習済み言語モデル、指示チューニング済み大規模言語モデルを用いて、ViLegalNLIに関する大規模な実験を行います。その結果、少数ショットのLLM構成が一貫して優れた性能を示す一方で、性能は仮説の長さ、語彙の重なり、そして推論の複雑さによって大きく影響されることが分かります。さらに領域横断の評価により、異なる法領域にわたって法的推論を一般化することの難しさが明らかになります。総じて、ViLegalNLIはベトナム語の法的NLIのための基礎的なベンチマークを確立し、法的推論、成文法テキスト理解、そして法務分析・意思決定支援のための信頼できるAIシステムの開発に向けた今後の研究を支援します。データセットは研究目的で公開されています。