要旨: 同じ被験者セットに対して複数のデータタイプを収集することは、ゲノミクス、メタボロミクス、神経画像法を含む現代の科学的応用で一般的です。 Joint and Individual Variance Explained (JIVE) は、共通の被験者に対して取得された2つ以上の特徴セット間の共通変動の低ランク近似を求め、この変動を各特徴セットに固有の変動から分離します。 私たちは JIVE フレームワークの確率モデルを推定するための期待値最大化(EM)アルゴリズムを開発します。 このモデルは、確率的主成分分析を複数データセットに拡張します。 私たちの最尤推定アプローチは、共通成分と個別成分を同時に推定し、他の手法と比較して精度を高める可能性があります。 私たちは ProJIVE を、アルツハイマー病における脳の形態測定と認知に適用します。 ProJIVE は生物学的に意味のある変動パターンを学習し、共通の形態測定と認知の被験者スコアは、より高価な既存のバイオマーカーと強く関連しています。 本論文の作成に使用されたデータは、アルツハイマー病神経画像イニシアティブ(ADNI)データベースから取得されました。 解析を再現するコードは、私たちの GitHub ページで利用可能です。
データ統合のための確率的結合および個別変動の説明(ProJIVE)
arXiv cs.LG / 2026/3/16
📰 ニュースTools & Practical UsageModels & Research
要点
- ProJIVEは、同一被験者から収集された複数のデータセット間の変動を共同および個別に捉えるための、EMベースの確率モデルを開発し、確率的PCAをマルチセットデータへ拡張します。
- 本手法は、最大尤度推定により結合成分および個別成分を推定するため、従来のJIVEアプローチと比較して精度が向上する可能性があります。
- 著者らはこのアプローチを、アルツハイマー病における脳形態計測と認知機能指標を用いて実証しており、結合スコアが費用のかかるバイオマーカーと整合することを示しています。
- 解析を再現するためのコードをGitHubに公開しており、他のマルチモーダルデータセットへの適用を促進しています。

