HGNet:学術論文から自動的に知識グラフを生成するためのスケーラブルな基盤モデル

arXiv cs.CL / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、学術論文からのゼロショット知識グラフ生成を対象とし、長い複数語エンティティの認識と領域汎化に焦点を当てた、2段階のスケーラブルな枠組みHGNetを提案する。
  • NER段階(Z-NERD)では、直交的セマンティック分解(Orthogonal Semantic Decomposition)と、マルチスケールTCQKアテンション機構(Multi-Scale TCQK attention)を用いて、領域をまたいだ一貫性のある複数語エンティティ抽出を改善する。
  • 関係抽出段階では、階層構造に配慮したメッセージパッシング(hierarchy-aware message passing)により、親/子/兄弟(peer)の関係を階層的にモデル化し、微分可能な階層損失(Differentiable Hierarchy Loss)と連続体抽象場(Continuum Abstraction Field: CAF Loss)によってグローバルなグラフ整合性を強制する。
  • 著者らは、階層的な抽象をユークリッド埋め込み空間上の連続的な性質として扱うことで、双曲埋め込み(hyperbolic embedding)アプローチに対するより単純な代替案を提示できると主張している。
  • 彼らは、階層関係抽出のための多領域ベンチマークSPHEREを公開し、SciERC、SciER、SPHEREにおいて、分布外およびゼロショットのテストで大きなNER/REの改善を含む最先端結果を報告している。

概要: 自動化された知識グラフ(KG)の構築は、急速に拡大する科学文献の集合をナビゲートするうえで不可欠です。しかし、既存の手法は、長い複数語エンティティの認識が難しいことが多く、ドメインをまたいだ一般化に失敗しがちで、さらに科学的知識の階層的な性質を見落とすことが典型的です。汎用の大規模言語モデル(LLM)は適応性を提供しますが、計算コストが高く、専門的タスクに対しては精度が一貫しないという問題があります。その結果、現在のKGは浅く一貫性に欠けており、探索や統合に対する有用性が制限されています。本研究では、スケーラブルでゼロショットな科学KG構築のための二段階フレームワークを提案します。第1段階のZ-NERDでは、(i) 意味の直交分解(OSD)を導入し、テキスト内で意味の「転換(turn)」を切り出すことで、ドメイン非依存のエンティティ認識を促進します。加えて、(ii) n-gramに対応した注意ヘッドによって首尾一貫した複数語エンティティを捉えるマルチスケールTCQK注意機構を導入します。第2段階のHGNetは、階層を考慮したメッセージパッシングによる関係抽出を行い、親・子・同輩の関係を明示的にモデル化します。グローバルな整合性を強制するために、2つの相補的な目的関数を導入します。すなわち、サイクルやショートカット辺を抑制するための微分可能な階層損失(Differentiable Hierarchy Loss)と、ユークリッド空間内の学習可能な軸に沿って抽象化レベルを埋め込む連続体抽象化場(CAF)損失です。この方法は、階層的な抽象化を標準的なユークリッド埋め込みの連続的な性質として形式化する初めてのアプローチであり、双曲線(ハイパボリック)手法に代わるより単純な選択肢を提供します。階層関係抽出のためのマルチドメインベンチマークSPHERE(https://github.com/basiralab/SPHERE)を公開します。本フレームワークはSciERC、SciER、およびSPHEREにおいて新たな最先端の状態を確立し、分布外テストでNERを8.08%、REを5.99%改善します。ゼロショット設定では、NERで10.76%、REで26.2%の向上が得られます。

HGNet:学術論文から自動的に知識グラフを生成するためのスケーラブルな基盤モデル | AI Navigate