永続ホモロジーに基づく時系列の類似度の安定した尺度

arXiv stat.ML / 2026/4/21

💬 オピニオンModels & Research

要点

  • この論文では、永続ホモロジーに基づく2つの時系列を比較する新しい類似度指標「bi-conditional periodicity score(score(f1,f2))」を提案する。
  • 提案スコアが、時系列や周波数に対する小さな摂動のもとで安定であることを理論的に保証し、さらに収束のための埋め込み次元に関する条件(最小埋め込み次元が必要になり得ること)も示す。
  • 次元削減についても安定性を証明しており、直交射影で最初のK主成分が大半の分散を捉える限り、スコアは小さくしか変化しないと述べている。
  • score(f1,f2)を計算するアルゴリズムを提示し、その計算量は O(N log N + PK^2 + P^6)(N=時系列点数、P=埋め込み点数、K=主成分数)とされる。
  • 合成データと気候データでの実験により、既存指標%DETに比べて提案手法がより安定であることを検証し、さらに調整パラメータが1つで済む点を強調している(%DETは4つ)。

Abstract

永続ホモロジー(永続相同性)は、データ内に現れる「穴」を研究するものであり、時間の経過とともに各データ点を中心とするボールを厚くしていくことで、その穴がどのように現れるかを調べます。この分野では理論的に安定性が保証されています。すなわち、データの小さな摂動は、これらの穴の寿命の小さな変化を保証します。この安定性は、単一の一変量時系列に対する周期性の指標を構築するために用いられており、score(f1) と表します。2つの時系列間の類似性を測る代表的な指標の1つに、%DET(% determinism)があります。これは、2つの時系列の埋め込み(embedding)同士の相関を測定するものです。本研究では、bi-conditional periodicity score(双条件周期性スコア)と呼ぶ、永続ホモロジーに基づく時系列類似性の新しい指標を導入し、score(f1,f2) と表します。さらに、我々の指標が小さな時系列および周波数の摂動に対して安定であることを証明します。また、我々のスコアが収束するための最小埋め込み次元が存在することも証明します。後者の結果は、所望の収束レベルに到達するには、より大きな埋め込み次元が必要になる可能性を示唆します。これらのより大きな次元における点間距離は集中し始めることがあるため、次元削減に対する我々の指標の安定性も証明します。これは、直交射影のもとで最初のK個の主成分が分散の大部分を捉えている限り、スコアが小さな変化しか受けないことを保証します。次に、bi-conditional periodicity score を計算するためのアルゴリズムを導入し、その計算複雑度を、時系列点の個数を N、埋め込み点の個数を P、主成分の個数を K として O(N log N + PK^2 + P^6) と推定します。実験により、合成時系列および実際の気候データの両方において、%DET と比較して本指標がより高い安定性を示すことを確認します。さらに、score(f1,f2) は計算に必要なパラメータが1つだけであるのに対し、%DET は4つを必要とします。