ニューラルモデルにおける概念表現を分析するための枠組み
arXiv cs.CL / 2026/5/5
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、概念表現を評価するために「包含(概念がサブスペース内では表現されるが外では表現されないか)」と「非絡み合い(他の概念からの隔離度)」の2軸で概念サブスペースを調べる統一的な枠組みを提案している。
- テキストと言語(音声)モデルでの実験では、概念サブスペースは必ずしも一意に定まらないことが示され、概念サブスペース分析の解釈に影響を与えると論じている。
- 異なるコミュニティで提案された5種類の推定器を比較した結果、推定器の選択が包含性と非絡み合い性の測定結果に大きく影響することが分かった。
- 概念消去手法LEACEは両方の軸で良好に機能する一方、未見データへの一般化には依然として課題が残る。
- HuBERTの音声表現では、電話(phoneme)情報は話者情報に対して包含されかつ非絡み合っているが、話者情報は電話から非絡み合っていてもコンパクトなサブスペースに収めるのが難しい。




