HopRank:グラフ上での自己教師ありLLM嗜好チューニングによる少数ショットノード分類

arXiv cs.CL / 2026/4/21

📰 ニュース

要点

  • HopRankは、グラフのトポロジーとホモフィリー原理(連結したノードは同じクラスを共有しやすい)を活用することで、テキスト属性を持つグラフに対するノード分類を自己教師ありで行う方法を提案する。
  • この手法はノード分類をリンク予測スタイルの問題として言い換え、階層的なホップに基づくサンプリングによって嗜好データを生成し、ゼロのクラスラベルを用いた適応的な嗜好学習によってLLMをチューニングする。
  • 推論時には、LLMにノードのテキストを直接ラベルへ対応付けさせるのではなく、ラベル付きアンカーノードへの接続嗜好を予測することでノードを分類する。
  • 著者らは、3つのTAGベンチマークでの実験により、訓練にラベル付きデータを一切用いないにもかかわらず、完全教師ありGNNと同等の性能を達成し、さらに従来のグラフ×LLM手法を大きく上回ることを報告している。
  • このフレームワークには、確信の高い投票が得られた時点で推論を停止することで推論コストを削減する適応的な早期終了(early-exit)投票メカニズムも含まれている。

要旨: テキスト属性付きグラフ(TAG)におけるノード分類は、引用分析、ソーシャルネットワーク、推薦システムなど幅広い応用を持つ基本的な課題である。現在のGNNベースの手法は、浅いテキスト符号化と、ラベル付きデータへの過度な依存に悩まされており、ラベルが乏しい状況での有効性が制限される。大規模言語モデル(LLM)は、深い意味的推論によって自然にテキスト理解のギャップを埋めるが、既存の「グラフに対するLLM」手法では、学習中に依然として大量のラベルを必要とするか、あるいはグラフ構造(トポロジー)によって自由に利用可能な豊富な構造的手がかりを十分に活用できていない。私たちの重要な観察は、多くの実世界のTAGではホモフィリー(同質性)の原理により、辺は主に類似したノード同士を結ぶという点である。つまり、グラフのトポロジーは、ラベルなしでクラス構造を本質的に符号化している。この洞察に基づき、私たちはノード分類をリンク予測タスクとして言い換え、TAG向けの完全自己教師ありのLLMチューニング枠組みであるHopRankを提案する。HopRankは階層的なホップ(距離)に基づくサンプリングによって嗜好データを構築し、クラスラベルなしで有益な学習シグナルを優先するための適応的な嗜好学習を用いる。推論時には、ラベル付きアンカーへの接続に対する嗜好を予測することでノードを分類し、効率を高めるための適応的な早期終了の投票方式を採用する。3つのTAGベンチマークに対する実験により、HopRankは完全教師ありGNNに匹敵し、学習時にラベル付きデータをゼロとしているにもかかわらず、従来のグラフ-LLM手法を大幅に上回ることが示された。

HopRank:グラフ上での自己教師ありLLM嗜好チューニングによる少数ショットノード分類 | AI Navigate