高次元の疎なポアソン計数データに対するNeighbor Embedding

arXiv stat.ML / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ポアソン分布でよく近似される高次元・疎な計数データに対する次元削減を扱い、PCAやt-SNEのような既存手法の前提(連続ユークリッド幾何)と不整合が生じる点を問題提起している。
  • p-SNE(Poisson Stochastic Neighbor Embedding)という非線形の近傍埋め込み手法を提案し、計数データのポアソン構造に合わせた設計を行っている。
  • p-SNEは、ポアソン分布間のKLダイバージェンスでペア間の非類似度を定義し、埋め込みの最適化にはヘリンガー距離を用いる。
  • 合成データおよび実データで評価し、メール通信の曜日パターン、OpenReview論文の研究領域クラスタ、神経スパイク記録の時間的ドリフト/刺激勾配など、意味のある構造の復元ができることを示している。
  • 階層化された幾何前提に基づく手法よりも、疎な計数データの背後にある確率モデルを取り込むことで埋め込み品質が改善しうることを示唆している。