概要:
マルチビュー学習は主に複数の特徴を統合してデータを総合的に記述することを目的とします。多くの先行研究は、異なるビューが類似の次元を共有していると暗黙のうちに仮定しています。実際には、異なるビュー間で深刻な次元差がしばしば存在し、それが不均衡なマルチビュー学習問題を招きます。例えば感情認識タスクでは、ビデオフレームの次元はしばしば 10^6 に達するのに対し、生理学的信号はわずか 10^1 次元しか持ちません。既存の手法は通常、この問題に対して2つの主要な課題に直面します:(1)高次元データに偏る傾向があり、低次元のビューを見落とします。(2)極端な次元不均衡の下で表現を効果的に整列させるのが難しく、低次元の表現に深刻な冗長性をもたらします。これらの問題に対処するため、Adaptive Multi-view Sparsity Learning(AdaMuS)フレームワークを提案します。まず、低次元ビューの情報を無視しないように、低次元ビューを統一された次元空間へ写像するビュー固有のエンコーダを構築します。低次元データを高次元空間へ写像することはしばしば過剰適合を引き起こすため、エンコーダの冗長なパラメータを適応的に削除するパラメータフリーの剪定法を設計します。さらに、冗長な次元を柔軟に抑制し、各ビューを効果的に整合させるスパース融合パラダイムを提案します。さらに、より強い一般化性能を持つ表現を学習するために、類似性グラフを構築して監督情報を得る自己教師付き学習パラダイムを提案します。合成データセットと7つの実世界ベンチマークでの広範な評価は、AdaMuS が一貫して優れた性能を発揮し、分類タスクとセマンティックセグメンテーションの両方で強い一般化性能を示すことを示しています。
AdaMuS: 次元的に不均衡なデータに対する適応的マルチビュー・スパース性学習
arXiv cs.LG / 2026/3/19
📰 ニュースModels & Research
要点
- AdaMuS は、異なるビューが大きく異なる次元を持つ不均衡なマルチビュー学習に対して、ビュー固有のエンコーダを用いてすべてのビューを統一表現空間に写像することで対処します。
- 高次元マッピングが関与する場合に発生する過学習を緩和するため、冗長なエンコーダのパラメータを削除するパラメータフリーの剪定法を導入します。
- 冗長な次元を柔軟に抑制し、ビュー間での表現をより適切に揃えるためのスパースな融合パラダイムを提案します。
- このフレームワークには、類似性グラフを構築して教師信号を提供し、一般化を向上させる自己教師付き学習コンポーネントが含まれます。
- 合成データと7つの実世界ベンチマークでの実験により、AdaMuS は分類とセマンティックセグメンテーションの両タスクで優れた性能と強い一般化能力を示しました。


