情報幾何学からジャートサブストラクチャへ:キュムラント・テンソル、エネルギー相関子、ハイパーグラフのトライリティ

arXiv stat.ML / 2026/5/6

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ペアワイズのフィッシャー情報グラフ(局所共分散に基づく)が、通常のペア相関へと縮約されてしまうため、不可約な複数観測量の放射パターンを見分けられない理由を説明しています。
  • 欠けている構造を高次のフィッシャー・テンソルが補うことを示し、binned EEC/ECF/EFPといった有限のエネルギー相関子基底の中で、同じ局所テンソルが3つの同値な解釈を持つことを明らかにします。
  • 「トライリティ」は、(i)局所Kullback–Leibler展開の係数、(ii)選んだ相関子の連結キュムラント、(iii)それらの観測量を結ぶハイパーグラフにおける符号付きハイパーエッジ重みを結び付けます。
  • フィッシャーの二次行列から最初の非自明な高次テンソルへ拡張することで、真に連結した複数観測量の放射パターンを特定し、高次ラプラシアンやメッセージパッシングのためのハイパーエッジ重みを原理的に導きます。
  • この枠組みは4つの適用例で検証され、三次フィッシャーテンソルによるKL打ち切り誤差の改善、ハイパーグラフに基づく圧縮基底でのジャートサブストラクチャ分類の改善、学習ベンチマークでのメッセージパッシングに対する解釈可能な帰納バイアスが示されています。

Abstract

ペアワイズFisherグラフは局所の共分散情報を捉えますが、既約な複数観測量にまたがる放射パターンを、通常のペアワイズ相関の集合から区別することはできません。我々は、この欠けている構造が高次のFisherテンソルによって自然に補われることを示します。区切られたEEC、ECF、またはEFPの有限の基底、およびその基底によって生成される自然指数族座標において、同じ局所テンソルは3つの等価な解釈を持ちます。すなわち、局所Kullback-Leibler展開における係数、選ばれた相関観測量の連結キュムラント、そしてそれらの観測量を結ぶハイパーエッジ上の符号付きの重みです。これにより、局所指数族埋め込みにおいて、Fisher-相関-ハイパーグラフの三位一体(triality)が厳密に成立します。この三位一体は、相関データから物理に基づいたハイパーグラフを直接構成することを可能にします。二次のFisher行列を最初の非自明な高次テンソルへ拡張することで、本当に連結された複数観測量にまたがる放射パターンを特定でき、より高次のラプラシアンとメッセージパassingのためのハイパーエッジ重みを与え、ペアワイズ情報を超えて観測量基底を圧縮するための原理的な基準を提示します。これらの構成を開発し、厳密なキュムラント解釈が自然指数族座標に特有である理由を明確にします。4つの応用において枠組みを説明します。最小の局所-KL研究では、三次のFisherテンソルがKL打ち切り誤差を低減し、支配的な3つ組(トリプレット)の構造を分離します。2対3のプラング(prong)ジェット下構造のベンチマークでは、ハイパーグラフセレクタが圧縮基底による分類を改善します。33観測量の基底設計問題では、Fisherハイパーグラフは12観測量においてより多くの第三次の局所応答を保持します。低キャパシティ学習ベンチマークでは、同じFisherハイパーエッジを、相関観測量上のメッセージパassingに対する解釈可能な帰納的バイアスとしてどのように用いることができるかを示します。