概念単位のアテンションによるきめ細かな概念ボトルネックモデル

arXiv cs.CV / 2026/4/20

📰 ニュースModels & Research

共有:

要点

この論文は、CLIPのような画像-テキスト整合を利用する従来手法を超えて、概念ボトルネックモデル（CBM）の微細な画像-概念整合を改善するCoAt-CBMを提案しています。
既存の概念モデリングが抱える限界（粒度の不一致や構造的事前知識への依存などの事前学習バイアス、BCEが概念を独立として扱うことによる学習の非最適化）に対処します。
CoAt-CBMでは、学習可能な概念単位のビジュアルクエリを用いて適応的に概念ごとの視覚埋め込みを抽出し、解釈可能な予測のための概念スコアベクトルを生成します。
概念スコアの相対的な重要度を考慮する新しい「概念コントラスト最適化」を導入し、予測された概念が画像内容をより忠実に反映するよう整合性を高めます。
実験では、最先端のCBM手法に対してCoAt-CBMが一貫して優れていることが報告され、コードは採択後に公開予定です。

Dev.to

Dev.to

Reddit r/artificial

Dev.to

Dev.to