概念ボトルネックモデルによる認識論的・アレオトリック不確実性の分解:Credal Concept Bottleneck Models

arXiv cs.AI / 2026/4/28

📰 ニュースModels & Research

要点

  • 本論文では、概念ボトルネックモデル(CBM)に基づき、概念レベルの不確実性を認識論的(還元可能)とアレオトリック(不可避)に分解する新しい枠組みCREDENCEを提案しています。
  • CREDENCEは各概念をクレダル予測(確率区間)として表現し、モデル自身の確率出力に根ざした不確実性推定を可能にします。
  • 認識論的不確実性は複数の概念ヘッド間の不一致から算出し、アレオトリック不確実性は(可能な場合)アノテータの不一致を反映するよう学習した専用の曖昧さ出力で推定します。
  • 本手法は意思決定に直結することを目的としており、低不確実性のケースは自動化、高い認識論的不確実性ではデータ収集を優先、高いアレオトリック不確実性は人の確認に回す、そして両方が高い場合は棄却するといった方針を支援します。
  • 複数タスクの実験では、認識論的不確実性は予測誤差と正の相関を示し、アレオトリック不確実性はアノテータの不一致により近く追従することが確認され、誤差相関だけでは得られない示唆が得られます。

Abstract

概念ボトルネックモデル(CBM)は、人間が解釈可能な概念を通じて推論しますが、通常は「点(point)」の概念確率を出力するため、エピステミック不確実性(還元可能なモデルのアンダースペシフィケーション)とアレアトリック不確実性(不可避な入力の曖昧さ)を混同してしまいます。これにより、概念レベルの不確実性の解釈が難しくなり、さらに重要なこととして、それに基づく行動も困難になります。そこで本研究では、CREDENCE(Credal Ensemble Concept Estimation)を導入します。CREDENCEは、概念不確実性を構成(設計)によって分解するCBMの枠組みです。CREDENCEは各概念を「確率区間」であるクレダル予測(credal prediction)として表現し、複数の多様な概念ヘッドにまたがる不一致からエピステミック不確実性を導出し、利用可能な場合は注釈者の不一致に合わせるように訓練された専用の曖昧性出力によってアレアトリック不確実性を推定します。その結果得られる信号は、指示(処方)的な意思決定を支援します。すなわち、不確実性が低い場合は自動化し、エピステミック不確実性が高い場合はデータ収集を優先し、アレアトリック不確実性が高い場合は人によるレビューに回し、両方が高いときは判断を保留(abstain)します。複数のタスクにおいて、エピステミック不確実性が予測誤差と正の相関を持つことを示す一方、アレアトリック不確実性は注釈者の不一致を密に追跡し、誤差相関を超えた指針を提供します。本実装は以下のリンクで公開しています: https://github.com/Tankiit/Credal_Sets/tree/ensemble-credal-cbm