DiRe-RAPIDS:トポロジーを忠実に保つ次元削減を大規模に
arXiv cs.LG / 2026/4/29
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、UMAPやt-SNEのような次元削減手法が局所近傍に基づく目的関数を最適化することで、サンプリングノイズを温存しつつデータのグローバルトポロジーを歪め得ると指摘しています。
- 著者らは、優れた埋め込みがノイズを“記憶”してしまい、元データに存在しないサイクルや孤立した島などの人工的な特徴を生み出すことがあると報告しています。
- 既知のホモロジーを持つノイズ付き多様体を用いた「トポロジー忠実度」ベンチマークを提案し、DiReをそれに合わせて調整したと述べています。
- 実験では、DiReが分類タスクでGPU加速UMAPと同等以上の性能を示しつつ、トポロジーストレステストでは第1ベッティ数を正確に復元できることを示しています。
- arXiv論文埋め込み723K件の大規模検証で、DiReは同程度の計算時間(ウォールクロック)でUMAPより3〜4倍多くのトポロジー構造を保持したと主張しています。



