教師なしアクションセグメンテーションのためのディープカーネルによる動画近似
arXiv cs.CV / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、大規模データセットの保存が制限または禁止されるような状況を想定した、1本の動画単位で行う教師なしアクションセグメンテーション手法を提案します。
- 動画を、深いカーネル空間で近似を学習し、フレーム分布の近さを最大平均差異(MMD)で評価することで分割します。
- カーネル空間の定義にはニューラルタンジェントカーネル(NTK)を用い、固定カーネルより表現力を高めるとともに、近似とカーネル関数を同時に学習する際の自明な解を回避します。
- 6つの標準ベンチマークで既存の最先端手法と比較した結果、競争力のある性能を示し、セグメント数が未知の場合でも先行するアグロメレーティブ系手法より高いF1スコアを達成します。



