アブストラクト: 検索のために用いられる知識グラフでは、すべての事実を同じくらい現在性があるものとして扱います。既存の時間的アプローチは一様な減衰を適用し、知識の種類に関わらず、単一の忘却曲線を用います。本稿では、これが根本的に誤設定であることを示します。すなわち、異なる知識タイプは異なる時間ダイナミクスを示し、主要な検索問題はレイテンシやスループットではなく、クエリ時点で何が重要かを特定することです。
本稿では、一様な減衰を、2つの直交する信号によってパラメータ化された連続減衰サーフェスで置き換える階層的フレームワークを提案します。速度(ある概念が観測される頻度)と、ボラティリティ(観測間で値がどれだけ変化するか。埋め込み距離により測定)です。減衰サーフェスは、3つの学習可能なレベルに分解されます。ドメイン・レベルのパラメータは普遍的なパターンを捉えます(ある述語は本質的に恒久的で、別の述語は本質的に一時的です)。コンテキスト・レベルのパラメータは、状況依存の変動を捉えます。そしてエンティティ・レベルの適応により、特定の対象に対して減衰が個別化されます。これらすべてのパラメータは、観測された値の寿命に対する生存分析によりデータから導出され、事前に定義された分類体系やドメイン知識は不要です。
本稿では、エッジ寿命を生存問題として定式化します。ここでイベントは、現在の値に対して意味的に異なる値が取って代わる「値の上書き(value supersession)」であり、単なる再観測とは区別されます。合成の時間的知識グラフに対する実験では、埋め込まれた階層パラメータの回復が示されます(HDBSCAN ARI = 1.0)。
Syntheaの臨床EHRシミュレータから得た107のWikipedia記事と1,163件の患者レコードでの検証では、速度・ボラティリティのクラスタが自然に現れ、観測可能な持続性パターンと整合し、ほぼ普遍的にリンドィ効果を示すことがわかります(Weibullの形状パラメータ k < 1)。一様減衰は、時間的重み付けなしの場合より18倍悪化します。異質な減衰はこれを回復し、各階層レベルが測定可能な改善に寄与します。
すべての記憶が同じように老いるわけではない:知識グラフにおける適応的減衰の自己発見
arXiv cs.LG / 2026/5/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、知識グラフの検索では事実がすべて同じ「現在性」を持つ扱いになっており、単一の一様な減衰(忘却曲線)を使う手法は時間的ダイナミクスの点で根本的に誤っていると指摘する。
- 観測頻度を表す速度(velocity)と、値が観測間でどれだけ変化するかを表すボラティリティ(volatility、埋め込み距離で推定)という2つの独立した信号に基づいて連続的な減衰をモデル化する、階層的な適応減衰フレームワークを提案する。
- 減衰をドメインレベル・コンテキストレベル・エンティティレベルの3段階に分解し、述語の性質や状況に応じて固有の老化パターンを学習できるため、事前に分類体系やドメイン知識を用意する必要がない。
- エッジの寿命を「再観測」ではなく「意味的に異なる値での置換(value supersession)」をイベントとする生存分析として定式化し、問い合わせ時に何が重要かをより適切に捉える。
- 合成時系列知識グラフでの実験では階層パラメータの回復に成功(HDBSCAN ARI = 1.0)し、WikipediaおよびSyntheaの臨床EHRシミュレーションでも速度–ボラティリティのクラスタが自然に現れ、一様減衰は時間重み付けなしより18倍悪いことが示される。




