高次元マルチビューデータにおける共分散構造の推論

arXiv stat.ML / 2026/4/20

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、高次元マルチビューデータにおける共分散推定を扱い、共有およびビュー固有の潜在因子を用いる既存の因子分析的手法を改善します。
  • 少なくとも1つのビューで活性な潜在因子を推定・整合させるために、スペクトル分解に基づくアプローチを提案しています。
  • 因子負荷と残差分散に対して同時共役な事前分布を選ぶことで、事後分布をMCMCなしで簡潔に計算でき、各変数ごとに正規-逆ガンマ分布へと分解されます。
  • 増次元漸近に関する理論的結果として、事後収束(posterior contraction)や点推定の中心極限定理(central limit theorems)を示します。
  • シミュレーションでは不確実性の定量も含めて良好な性能を示し、さらにがん細胞のマルチオミクスにおける4つの高次元ビュー統合への適用例も示します。

要旨: この記事は、多視点データに対する共分散推定に焦点を当てる。一般的なアプローチは、共有の潜在因子と視点固有の潜在因子を伴う因子分析的分解に依拠している。事後計算は、高価で壊れやすいマルコフ連鎖モンテカルロ(MCMC)サンプリング、あるいは不確実性を過小評価し、理論的保証を欠く変分近似によって行われる。提案手法は、少なくとも1つの視点で活性な潜在因子を推定し整合させるためにスペクトル分解を用いる。これらの因子に条件づけることで、因子負荷と残差分散に対する同時に共役な事前分布を選択する。その結果得られる事後分布は、各変数に対して正規—逆ガンマ分布の単純な積となり、MCMCを回避して事後計算を容易にする。点推定量に対する事後収束(posterior contraction)や中心極限定理を含む、望ましい次元増加に関する漸近的性質を証明する。シミュレーションでは、正確な不確実性の定量化を含めて優れた性能を示し、がん細胞サンプルの多オミクス・データセットから高次元の4つの視点を統合するために本手法を適用する。