構成的解釈性に基づく固有概念抽出

arXiv cs.CV / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、拡散ベースのテキストから画像へのモデルを用いて、単一の画像から組成可能な物体レベルおよび属性レベルの概念を抽出する新しいタスクCI-ICEを導入し、これらの概念の組み合わせによって元の概念を再構成できるようにする。
  • CI-ICEに取り組むためにHyperExpressを提案する。二つの核となる構成要素は次のとおりである:(1) 階層関係を保持しつつ概念の分離を達成する双曲空間ベースの概念学習アプローチ、(2) 複雑な概念間関係と概念の組成性を維持するよう埋め込みをマッピングする概念別最適化手法。
  • 本手法は、単一の画像から構成可能で解釈可能な固有概念を抽出する際に卓越した性能を示し、視覚-言語モデルにおける教師なし概念抽出と解釈可能性の向上に寄与する。
  • 本研究は、説明可能性の向上と制御可能な画像生成の可能性に影響を及ぼす可能性があり、下流のAIシステムが物体および属性概念について推論する方法に影響を与える可能性がある。
教師なし概念抽出は単一の画像から概念を抽出することを目的とする。しかし、既存の手法は組成可能な固有概念を抽出できないという課題がある。これに対処するため、本論文はCompositional and Interpretable Intrinsic Concept Extraction(CI-ICE)と呼ばれる新しいタスクを導入する。CI-ICEタスクは、拡散ベースのテキストから画像へのモデルを活用して、単一の画像から組成可能な物体レベルおよび属性レベルの概念を抽出し、これらの概念の組み合わせによって元の概念を再構成できるようにする。これを達成するため、私たちはHyperExpressと呼ばれる手法を提案し、このCI-ICEタスクに二つの核心的側面から取り組む。具体的には、第一に、双曲空間の固有階層モデリング能力を活用して、概念間の階層構造と関係依存性を保持しつつ、概念の正確な分離を実現する概念学習アプローチを提案する。第二に、概念埋め込み空間をマッピングして、複雑な概念間関係を維持しつつ概念の組成性を保証する概念ごとに最適化する方法を導入する。我々の手法は、単一の画像から構成可能で解釈可能な固有概念を抽出する際に卓越した性能を示している。