要旨:Generalized Category Discovery (GCD) は、ラベルなしデータから新しいカテゴリを見つけ出しつつ、既知のカテゴリの認識を維持することを目指します。しかし、従来の視覚情報のみのパイプラインと、監督付き学習と発見の間の緩い結合は、細かな差異を持つ見た目が似ているカテゴリにおいて脆い境界を生みがちです。私たちは、Analogical Textual Concept Generator (ATCG) を紹介します。これはラベル付き知識から新しい観測へアナロジーを適用するプラグアンドプレイ型モジュールで、未ラベルサンプルのテキスト概念を形成します。これらのアナロジー的テキスト概念と視覚特徴を統合することで、発見は視覚-テキスト推論プロセスへと変換され、既知の知識を新しいデータへ転送し、カテゴリの分離を鋭くします。ATCG は、パラメトリック型およびクラスタリング型の GCD パイプラインの双方に取り付け可能で、それらの全体設計を変更する必要はありません。6つのベンチマークを通じて、ATCG は全体・既知クラス・新規クラスのパフォーマンスを一貫して向上させ、特に細粒度データで最大の効果を示します。コードは以下のリンクで入手できます:https://github.com/zhou-9527/AnaLogical-GCD.
人間のように学ぶ:一般化されたカテゴリ発見のための類推概念学習
arXiv cs.CV / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- アナロジカル・テキスト概念生成器(ATCG)は、ラベル付き知識から新たな観察へアナロジーを用いて、ラベルなしサンプルのためのテキスト概念を形成するプラグアンドプレイモジュールです。
- これらのテキスト概念と視覚特徴を融合することで、ATCGは発見を視覚-テキスト推論プロセスへと変換し、既知の知識を新規データへ転移させ、カテゴリ分離をよりくっきりとさせます。
- ATCGは、パラメトリック型とクラスタリング型のGCDパイプラインの両方に追加でき、全体設計を変更することなく適用できます。
- 6つのベンチマークを通じて、ATCGは全体性能、既知クラス、および未知クラスの性能を一貫して向上させ、特に細粒度データで最大の改善を示します。コードはGitHubで公開されています。