グローバルなAI規制をナビゲートするための、多管轄・リトリーバル拡張生成(RAG)システム

arXiv cs.CL / 2026/4/29

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本稿は、研究者・政策立案者・法務担当者が国や地域をまたいだAI規制を扱いやすくするための、多管轄対応のリトリーバル拡張生成(RAG)システムを提案する。
  • 242件の文書を68管轄から収集し、EU AI Actのような形式的な法令だけでなく、各国のAI戦略のような非構造の政策文書も含めたコーパスを構築している。
  • 主要な技術貢献として、法的な構造を保持する型(文書タイプ)別チャンク化、法的引用を意識した実体検出とメタデータによる条件付きリトリーバル・ルーティング、政策や二次資料よりも制定法を優先する優先度ベースの再ランキングを挙げている。
  • 50件のクエリで評価した結果、平均忠実度0.87、平均回答関連性0.84と良好な性能を示し、単一主体の質問では特に関連性が高い(平均0.92)。
  • 総じて、複雑で異種混在する規制文書コーパスに対しては、領域特化のリトリーバル戦略が性能向上に有効であることを示唆している。

要旨: 法域(管轄区域)をまたいだAI規制のナビゲーションは、政策立案者、法律専門職、研究者にとってますます難しくなっています。そこで本研究では、グローバルなAI規制のためのマルチ・ジャリスディクション(複数法域)対応のRetrieval-Augmented Generation(検索拡張生成)システムを提示します。私たちのコーパスには、EU AI Actのような正式な立法から、各国のAI戦略のような非構造化の政策文書まで、68の法域にまたがる242文書を収録しています。システムは、3つの技術的貢献を行います。第一に、異種の文書にまたがって法的構造を保持するタイプ固有のチャンク化。第二に、法的引用のためのエンティティ検出とメタデータを備えた条件付きリトリーバル(検索)ルーティング。第三に、政策および二次情報よりも制定済みの立法を優先して押し上げる優先度ベースの再ランキングです。50のクエリを評価した結果、単一エンティティと複数法域にまたがる質問の両方で強い性能が確認され、平均忠実度0.87、平均回答の関連性0.84を達成しました。単一エンティティのクエリでは平均忠実度0.86、平均回答の関連性0.92であり、一方、複数法域の比較クエリでは平均忠実度0.88、平均回答の関連性0.75でした。これらの結果は、複雑で異種な規制コーパスをナビゲートするためのドメイン固有の検索戦略の有効性を示しています。