情報ボトルネックを低次元問題へ還元する十分統計量の削減

arXiv stat.ML / 2026/4/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、条件付き分布 p(C|T) が十分統計量 ϕ(T) を通じてのみ T に依存する場合、情報ボトルネック(IB)問題は (T,C) での問題と (ϕ(T),C) での問題が厳密に同値になることを示します。
  • この削減は損失なしであり、IB曲線全体、各ラグランジュのトレードオフ係数 η における最適化結果、そして最適な表現は ϕ を通じた引き戻しまで含めて保持されます。
  • その結果、IB を解く計算複雑性は、元の入力 T の次元ではなく、十分統計量 ϕ(T) の次元によって決まることが示されます。
  • 既知の領域との関係として、古典的なガウス型IB解(Chechikら)をこの還元の直接の系として導出し、さらに非線形ガウスの一般化も述べています。
  • 小さな数値例により、低次元の十分統計量が利用できるとき、削減後の問題を用いて統計量の次元に応じたコストで IB 曲線の厳密計算が可能になるという実務的な利点を示します。

Abstract

条件付き分布 p(C | T) が十分統計量 {}(T) を通じて因数分解されるならば、(T, C) に対する情報ボトルネック(IB)問題は、({}(T), C) に対する IB 問題と厳密に同値であることを示します。この削減は損失がありません:それは完全な IB 曲線、あらゆるトレードオフパラメータ {eta} におけるラグランジアン最適解、および {} を通じた引き戻し(pullback)までの最適表現を保存します。その結果、IB 問題を解くための計算複雑性は、ソースの周辺(ambient)次元ではなく、十分統計量の次元によって支配されます。これは、汎用的な IB 問題が可解(tractable)になる正確な構造的条件を特定すると同時に、離散的な領域と線形ガウス(linear-Gaussian)領域の間を結ぶ形式的な橋を与えます。続いて、Chechik、Globerson、Tishby、Weiss による古典的ガウス IB 解が、この削減の直接の系であることを示し、さらに非線形ガウスへの一般化を述べます。小さな数値例により実際的な帰結を示します:低次元の十分統計量が利用可能な場合、周辺のソース次元ではなく、統計量によって定まる計算コストで、縮約問題上で厳密な IB 曲線を計算できるということです。