検証可能な概念アライメントのためのプロトタイプに基づくコンセプトモデルの試作

arXiv cs.LG / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Concept Bottleneck Models(CBM)は、人間が理解しやすい「概念」で予測を構造化することで解釈可能性を高めるが、学習された概念が人間の意図する意味と一致しているかを検証できないという課題がある。
  • 本論文では、Prototype-Grounded Concept Models(PGCM)を提案し、各概念を学習された視覚プロトタイプ(概念の根拠となる画像の部分)により根拠づける。
  • プロトタイプによる根拠づけにより、概念の意味論を直接検査できるようになり、プロトタイプ単位で人が介入して不一致を修正できる。
  • 実験では、PGCMが最先端のCBMと同等の予測性能を保ちつつ、透明性・解釈可能性・介入可能性を大幅に向上させることが示されている。

要旨: 概念ボトルネックモデル(CBM)は、人間が理解できる概念を介して予測を構造化することで深層学習の解釈可能性を高めることを目指しますが、学習された概念が人間の意図する意味と一致しているかどうかを検証する方法を提供しません。そのため解釈可能性が損なわれます。私たちは、学習した視覚プロトタイプに概念を基礎づけるプロトタイプ基盤概念モデル(PGCM)を提案します。ここで基礎づけとは、概念のための明示的な根拠として機能する画像の部分(イメージパーツ)により概念を支えることです。この基礎づけにより、概念のセマンティクスを直接検査でき、また、プロトタイプのレベルで誤った対応(ミスアラインメント)を修正するための、狙いを定めた人間の介入を支援できます。実証的に、PGCMは最先端のCBMと同等の予測性能を達成しつつ、透明性・解釈可能性・介入可能性を大幅に向上させます。