複雑なグラフに対する教師あり関係抽出では、LLMはグラフベースのパーサよりも性能が劣る

arXiv cs.AI / 2026/4/13

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、文レベルの言語グラフが非常に複雑であるケースに焦点を当て、教師あり関係抽出において4つのLLMをグラフベースのパーサと比較評価する。
  • 関係抽出の6つのデータセット(グラフのサイズと複雑さが異なる)にわたって、入力中の関係数が増えるにつれ、グラフベースのパーサの相対的な優位性が大きくなる。
  • 結果は、複雑なグラフにおいては、LLMが小規模なLLMではないアーキテクチャに依然として劣ることを示しており、特に関係が豊富な状況でその傾向が強い。
  • 著者らは、知識グラフ構築のために非常に複雑な言語グラフを扱う場合、LLMベースのアプローチよりも軽量なグラフベースのパースがより実用的な選択肢であると結論づけている。

Abstract

関係抽出は、知識グラフを構築するプロセスにおける基本的な構成要素であり、他にもさまざまな用途で重要な役割を担っています。大規模言語モデル(LLM)は、教師あり学習およびコンテキスト内学習の設定の双方において、関係抽出の有望な手段として採用されてきました。しかし本研究では、文章の背後にある言語的グラフの複雑さが非常に高い場合、LLMの性能がそれよりはるかに小規模なアーキテクチャに依然として後れを取っていることを示します。これを実証するために、サイズや複雑さの異なる文のグラフを用いる6つの関係抽出データセットに対して、4つのLLMをグラフベースのパーサと比較評価します。その結果、入力文書内の関係数が増えるほど、グラフベースのパーサがLLMをますます上回ることが分かりました。したがって、複雑な言語的グラフが存在する状況では、より軽量なグラフベースのパーサを選ぶ方が優れています。