PREF-XAI:ブラックボックス機械学習モデルに対する嗜好(プレファレンス)ベースのパーソナライズされたルール説明

arXiv cs.LG / 2026/4/22

📰 ニュースModels & Research

要点

  • この論文は、XAIの説明はモデル中心の近似に留まるのではなく、ユーザーの目的・嗜好・認知的制約に応じて個別化されるべきだと主張しています。
  • PREF-XAIとして、説明生成を「嗜好に基づく選択問題」として捉え、複数の説明候補をユーザー固有の基準で評価・選抜すると位置づけています。
  • 提案手法では、ルールベースの説明候補を作り、少数のランキングによる嗜好の聴取と、ロバストな順序回帰により推定した加法的効用関数でユーザー嗜好を学習します。
  • 実データセットでの実験により、限られたフィードバックからユーザーの嗜好を再構成できること、関連性の高い説明を特定できること、さらにユーザーが最初に想定していなかった新しい説明ルールを発見できることが示されています。
  • XAIと嗜好学習を結び付けることで、ユーザー入力に応じて改善していくインタラクティブで適応的な説明システムの新たな方向性が示されます。

要旨: 説明可能な人工知 intelligence(XAI)はこれまで主に、ブラックボックスモデルの振る舞いを近似するモデル中心の説明を生成することに注力してきました。しかし、そのような説明はしばしば解釈可能性における根本的な側面を見落とします。すなわち、異なるユーザーは、自身の目標、好み、認知的制約に応じて異なる説明を必要とするという点です。近年、ユーザー中心のパーソナライズされた説明が検討されてきたものの、既存の多くのアプローチは、ヒューリスティックな適応や暗黙的なユーザーモデリングに依存しており、個々の好みを表現し学習するための原理的枠組みを欠いています。本論文では、嗜好(パラメータ)に基づく説明可能な人工知能(Preference-Based Explainable Artificial Intelligence; PREF-XAI)を、説明を嗜好に駆動された意思決定問題として捉え直す新しい観点として考察します。PREF-XAIの枠組みでは、説明は固定された出力として扱われるのではなく、ユーザー固有の基準に従って評価され選択されるべき代替案として扱います。このPREF-XAIの観点において、提案するのは、ルールベースの説明と形式的な嗜好学習を組み合わせる手法です。ユーザーの嗜好は少数の候補説明のランキングによって収集され、頑健な順序回帰を用いて推定される加法的効用関数によりモデル化されます。実世界のデータセットでの実験結果は、PREF-XAIが限られたフィードバックからユーザーの嗜好を正確に再構成できること、非常に関連性の高い説明を特定できること、さらにユーザーが当初考慮していなかった新たな説明ルールを発見できることを示しています。提案手法の範囲を超えて、本研究はXAIと嗜好学習との関連を確立し、対話的で適応的な説明システムに向けた新しい方向性を切り開きます。