Abstract
本論文では、高次元データの支配的な複素調和成分を明らかにすることを目的とした、新しい拡散マッピングの枠組みであるComplex Diffusion Maps(CDM)を提案する。熱方程式に関連する局所ガウス核と、シュレーディンガー方程式に関連する非局所シュレーディンガー核に触発され、局所的な連結と非局所的な連結のトレードオフのために、omegaパラメータ化された複素数値カーネルの統一的なファミリーを提案する。対応する拡散作用素、拡散距離、そして複素調和写像が適切に定義される、作用素スペクトル理論に基づく理論的基盤を確立する。さらに、写像の最適化に基づく解釈も開発し、実数値の大きさのみに依存するのではなく、複素拡散空間内での角度構造の保持を目指す。合成データと実世界データの両方に対して、CDMを広範に評価する。複素数値カーネルは、容易に見分けがつきにくいサンプル間の差を増幅し、実数値カーネルに基づく線形および非線形の手法のいずれよりも高い弁別能力を実現する。CDMは高ノイズ環境でも頑健であり、スペクトル分離を強化するより明瞭な固有ギャップをもたらす。安静時fMRIデータでは、CDMはより強い相関を持つ、かつ非局所的な時空間ダイナミクスを捉える。タスク固有のチューニングなしで、CDMは公開されているEEG睡眠データセットにおいて競争力のある性能を達成し、従来の機械学習手法および深層ニューラルネットワーク手法の両方と比較して高い計算効率を維持する。これにより、その一般性と実用上の価値が示される。