広告

NeurIPS 2022 WikiKG90Mv2-LSC に向けた TIEG-Youpu Solution

arXiv cs.CL / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本稿は、NeurIPS 2022で用いられた大規模百科事典型知識グラフ「WikiKG90Mv2」(9,000万超のエンティティ)を対象に、知識グラフ埋め込みのための新しい手法を提案しています。
  • 取得(retrieval)→再ランキング(re-rank)のパイプラインを採用し、構造的・意味的に類似した候補を得るための「priority infilling retrieval model」を導入しています。
  • 再ランキング段階では、近傍情報を強化した表現を用いるアンサンブル型再ランキングモデルで最終的なリンク予測を行います。
  • 実験では提案手法が既存ベースラインを上回り、バリデーションセットのMRRを0.2342から0.2839へ改善したと報告しています。

Abstract

NeurIPS 2022におけるWikiKG90Mv2は、大規模な百科事典的知識グラフである。知識グラフを連続的なベクトル空間へ埋め込むことは、知識獲得、質問応答、レコメンドシステムなど、多くの実用的応用において重要である。既存の知識グラフと比較して、WikiKG90Mv2は規模の大きい知識グラフであり、90百万以上のエンティティから構成される。大規模な知識グラフに対するグラフ埋め込みモデルを構築する際には、効率と精度の両方を考慮する必要がある。そこで本研究では、「検索してから再ランキングする」パイプラインに従い、検索段階と再ランキング段階の両方において新しい改良を行う。具体的には、構造的にも意味的にも類似した候補を得るための優先度付きインフィリング(priority infilling)検索モデルを提案する。次に、近傍を強化した表現(neighbor enhanced representations)を用いるアンサンブルに基づく再ランキングモデルを提案し、検索された候補間における最終的なリンク予測の結果を生成する。実験結果は、提案手法が既存のベースライン手法を上回り、検証セットのMRRを0.2342から0.2839へ改善することを示している。

広告