不完全マルチビュークラスタリングのための双曲線拡張表現学習(HERL)

arXiv cs.LG / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、不完全マルチビュークラスタリング(IMVC)において、欠落したビューがあっても判別的な表現を学習することを扱っています。
  • 既存のユークリッド(平坦)ベース手法は、現実データに内在する階層構造の幾何をうまく表現できず、空間的に近いが意味的には異なる近傍へ表現が寄って「意味のぼやけ」が起きると指摘しています。
  • このギャップを埋めるため、著者らはポアンカレ球内で動作する双曲線拡張表現学習フレームワークHERLを提案します。
  • HERLは、角度に基づく損失(方向の整合で意味的同一性を保持)と距離に基づく損失(階層的なまとまりを強制)からなる双対の双曲線コントラスト学習を設計し、さらにビュー間の階層情報に基づくプロトタイプ分布を整合させて大域的な構造ドリフトを補正する双曲線プロトタイプヘッドも導入しています。
  • 実験結果では、HERLが従来手法を一貫して上回り、クラスター境界の鮮明化と不完全ビュー下でのデータ復元の改善が示されるとされています。

要旨: 不完全マルチビュークラスタリング(IMVC)は、欠損ビューに対する頑健性を維持しつつ、断片的な観測から識別的表現を学習するという課題に直面しています。しかし、広く用いられているユークリッド距離ベースの手法は、実世界データに内在する階層構造をモデル化する際に幾何学的な不一致が生じるため、表現が空間的に近いが意味的に異なる近傍へと移動してしまう「意味のにじみ(semantic blurring)」が起こります。このギャップを埋めるために、本論文ではIMVC向けの双曲線拡張表現学習フレームワークであるHERL(Hyperbolic Enhanced Representation Learning)を提案します。ポアンカレ球内で動作するHERLは、構造を意識した潜在空間を構築して表現学習を強化します。具体的には、双制約の双曲線コントラスト学習メカニズムを設計し、次の2つを最適化します:方向の整合によって意味的同一性を保持するための角度ベースの損失、ならびに階層的なコンパクト性を強制するための距離ベースの損失です。さらに、双曲線プロトタイプヘッドを導入し、ビューをまたいだ階層を意識したプロトタイプ分布を整合させることで、グローバルな構造ドリフトを是正します。その結果、HERLは微細な意味的相関を切り離してクラスタ境界をより鮮明にし、幾何学的制約を課すことでデータ復元(データ回復)プロセスを是正します。大規模な実験結果により、HERLが一貫して最先端手法を上回ることが示されます。