信頼性の高い特許クレーム検証のための適応的で費用対効果の高い評価

arXiv cs.CL / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、軽量エンコーダの法的推論能力が限定されることと、LLMの評価コストが高いことのトレードオフがある中でも、ゼロ欠陥許容(defect tolerance)を満たして特許クレームを検証するためのACE(Adaptive Cost-efficient Evaluation)を提案する。
  • ACEは予測エントロピーを用いて、高不確実性のクレームのみを専門のLLMへ選択的にルーティングし、35 U.S.C. の法令基準に整合したChain of Patent Thought(CoPT)手順を実行する。
  • このアプローチは、運用効率を維持しつつ、長距離の法的依存関係をより適切に捉えることを目的としている。
  • 実験結果として、F1スコア94.95%を報告し、全クレームをLLMで評価する場合に比べてコストを78%削減した。
  • 著者らは、MPEPに基づく誤りアノテーションを備えた40,000クレームのベンチマーク「ACE-40k」を公開し、後続研究を支援する。

要旨: 特許クレームの自動検証には、欠陥ゼロの許容が求められます。たとえ1つの構造的な欠陥でも、クレームが法的に無効となり得るからです。既存の評価パラダイムは、硬直性とリソースのジレンマに悩まされています。軽量なエンコーダは、法的な依存関係の微妙なニュアンスを扱うのが難しい一方、Large Language Models(LLM)による網羅的な検証は、コストが非常に高くつきます。このギャップを埋めるために、我々はACE(Adaptive Cost-efficient Evaluation)を提案します。ACEは予測エントロピーを用いて、不確実性が高いクレームのみを専門家LLMへルーティングするハイブリッド枠組みです。専門家LLMは、35 U.S.C. の法定基準に基づく Chain of Patent Thought(CoPT)プロトコルを実行します。この設計により、ACEは効率を維持しつつ、より効果的に長距離の法的依存関係を扱えるようになります。ACEは、評価した手法の中で最良のF1を94.95\%で達成し、単独のLLM導入と比べて運用コストを78\%削減します。さらに、MPEPに基づく誤り注釈を付与した40,000クレームのベンチマークACE-40kも構築し、さらなる研究を促進します。