ランダムグラフにおける局所幾何の検出:情報理論的および計算論的限界

arXiv stat.ML / 2026/3/26

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、球面上のランダム幾何グラフにより生成される隠れコミュニティがあり、それ以外の部分はエルデシュ–レーニ(Erdős–Rényi)の辺に従うという混合ランダムグラフモデルにおいて、「局所幾何」信号の検出を研究する。
  • モデルは、辺の周辺分布が幾何の場合とヌル(無信号)場合で一致するように構成されているため、検出可能な信号は個々の辺の確率ではなく、高次の辺の依存関係からのみ生じる。
  • 著者らは、上界として符号付き三角形(triangle-count)検定を用い、下界としてWishart–GOE比較とKLダイバージェンスのテンソル化(tensorization)に基づく高度な手法を用いて、検出の情報理論的限界と計算論的限界の双方を導出する。
  • 固定したpに対する検出閾値を d = Õ(k^2 ∨ k^6/n^3) と特徴づけ、全モデル(k = n)での既存結果が、pが消失(vanishing)するレジームへどのように拡張されるかを示す。
  • 計算機アルゴリズム面では、計算–統計のギャップを特定し、低次数多項式(low-degree polynomial)フレームワークを用いて証拠を提示し、長さ ℓ ≥ 4 の符号付きサイクル数は最適ではないと主張する。

Abstract

本稿では、ランダムグラフにおける局所幾何の検出問題を研究する。平均サイズが k の隠れたコミュニティが mathbb{S}^{d-1} 上のランダム幾何グラフとして生成される一方、残りのすべての辺は Erd\H{o}s--R\'enyi モデル mathcal{G}(n, p) に従う、モデル \mathcal{G}(n, p, d, k) を導入する。ランダム幾何グラフは、潜在ベクトルの内積を mathbb{S}^{d-1} 上で閾値化することで生成され、各辺は周辺確率として p に等しい確率を持つ。したがって、 mathcal{G}(n, p, d, k) mathcal{G}(n, p) は周辺分布のレベルでは区別不能であり、信号は局所幾何によって誘導される辺間の依存関係のみに存在する。 検出の情報理論的限界と計算論的限界の両方を調べる。情報理論的側面では、上界は符号付き三角形カウントに基づく3つのテスト(大域テスト、スキャンテスト、制約付きスキャンテスト)に従う。一方、下界は2つの相補的な方法による。すなわち、Wishart--GOE 比較による打ち切り二次モーメントと、KLダイバージェンスのテンソル化である。これらの結果を総合すると、固定した p に対して検出閾値が d = \widetilde{\Theta}(k^2 \vee k^6/n^3) で確定することが分かり、さらに p が消失する場合には、完全モデル(すなわち k = n)からの最先端の境界を拡張する。計算論的側面では、計算—統計のギャップを特定し、低次数多項式の枠組みによって証拠を提示するとともに、長さ \ell \geq 4 の符号付きサイクルカウントが劣っている(最適でない)ことを示す。