広告

TDEC:Transformerと分布情報による深層埋め込み画像クラスタリング

arXiv cs.CV / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、従来の深層クラスタリング手法の制約、特に特徴融合および画像領域間にまたがるグローバルな文脈の認識能力に焦点を当て、クラスタリング性能の向上を目的とした深層埋め込み画像クラスタリング手法TDECを提案する。
  • TDECは、グローバルな依存関係を学習して識別的な表現を獲得するTransformerベースのT-Encoderと、よりクラスタリングに適した低次元埋め込み空間を生成するDim-Reduction(次元削減)コンポーネントを用いる。
  • 本手法は、クラスタリング時に埋め込み特徴の分布情報を取り入れることで、共同学習のためのより信頼性の高い教師あり信号を生成する。
  • 著者らは、TDECがデータサイズ、クラスタ数、画像文脈の複雑さが変化しても頑健であり、複雑なデータセットにおいて最近の競合手法よりも大幅に高い性能を達成すると報告している。

要旨: 画像クラスタリングはマルチメディア機械学習における重要な課題ですが、同時に難しい課題でもあります。近年、クラスタリングと深層学習を組み合わせることで、高次元の画像データに対して、従来手法に比べて有望な性能が得られることが示されています。しかしながら、既存の深層クラスタリング手法(DC)は、クラスタリング画像において、異なる画像領域間のグローバル知覚フィールドによる情報融合の重要性を、特に複雑なものではしばしば無視しています。加えて、学習された特徴は次元の観点でクラスタリングに不利であることが多く、クラスタリングに用いるための単純な距離情報のみに基づいています。そこで本研究では、画像クラスタリングのために、特徴表現、次元選好、および頑健な割り当てを初めて(本知見では)共同で考慮する、深層埋め込み画像クラスタリング TDEC を提案します。具体的には、Transformer を導入して、新規モジュール T-Encoder によりグローバルな依存関係を伴う識別的特徴を学習しつつ、Dim-Reduction ブロックを用いてクラスタリングを促進する友好的な低次元空間を構築します。さらに、クラスタリング過程では埋め込み特徴の分布情報も考慮し、共同学習のための信頼できる教師付き信号を提供します。本手法は頑健であり、データサイズ、クラスタ数、そして文脈の複雑さに対してより大きな柔軟性を可能にします。より重要な点として、TDEC のクラスタリング性能は近年の競合他手法よりも大幅に高いです。複雑なデータセットに対して、最先端のアプローチを用いた大規模な実験により、TDEC の優位性が示されます。

広告