要旨: 知識グラフ(KG)は、大規模言語モデル(LLM)の推論を支えるために、ますます広く用いられている。しかし、標準的な三つ組(トリプレット)ベースのKGでは、各関係がグローバルに有効であるとみなされる。多くの設定では、ある関係がエビデンスとして数えられるかどうかは文脈に依存する。そこで我々は、三つ組妥当性を文脈に対する三つ組固有の関数として定式化し、この定式化を量子知識グラフ(Quantum Knowledge Graph; QKG)と呼ぶ。我々はQKGを医療分野で実装するために、糖尿病中心のPrimeKGサブグラフを用い、その6万8651件の文脈感度の関係に、患者グループ固有の制約をさらに注釈付けした。KGに基づくMedReasonのサブセット(2,788問)における医療質問応答のため、推論器—バリデータ(validator)パイプラインで評価する。ReasonerとValidatorの両方にHaiku-4.5を用いると、バリデータなしのベースラインに比べて、KGに裏付けられた検証は有意に改善される(+0.61 pp)。また、文脈一致を伴うQKGが最大の改善を示し、文脈一致なしのKG検証(+0.79 pp)とバリデータなしベースライン(+1.40 pp)の両方を上回る(対応McNemar、すべて p<0.05)。より強力なValidator(Qwen-3.6-Plus)のもとでは、バリデータなしベースラインに対する生のQKGによる利得は+1.40 ppから+5.96 ppへと拡大する。文脈一致のギャップは、生データでは有意でない(p=0.73)が、知識リーケージと疑わしい質問への調整後には、境界付近で有意となる(p=0.05)。これは、QKGの制限というよりも、ベンチマークのゴールドに対する天井(ceiling)と整合的である。これらを総合すると、LLMベースの臨床推論におけるKGの価値は、医学的に関連する事実を保存することにとどまらず、それらの事実が特定の患者の文脈に対して適用可能かどうかを表現することにある、という見解を支持する。再現性と今後の研究のために、厳選したQKGデータセットとソースコードを公開する。\footnote{https://github.com/HKAI-Sci/QKG}
量子知識グラフ:文脈依存のトリプレット妥当性モデリング
arXiv cs.CL / 2026/4/28
📰 ニュースIdeas & Deep AnalysisIndustry & Market MovesModels & Research
要点
- 本論文は、標準的な知識グラフがLLM推論において制約になるのは、トリプレットの関係を全体的に有効とみなしてしまい文脈依存の妥当性を扱えないためだと主張している。
- 関係の妥当性を文脈に応じた関数としてモデル化する「Quantum Knowledge Graph(QKG)」を提案し、患者や状況に応じた根拠の重み付けを可能にしている。
- QKGは医学領域で、糖尿病中心のPrimeKGサブグラフを用いて実装され、68,651件の文脈依存トリプレットに患者グループ固有の制約を付与している。
- KGに基づく医療QA(MedReasonのKG-groundedサブセット、2,788問)において、reasoner–validatorパイプラインで、KGに基づくバリデーションが精度を改善し、文脈マッチングが最も大きな効果を示した。
- 著者らは再現性と今後の研究のために、厳選したQKGデータセットとソースコードを公開している。
