埋め込みに意味を見いだす:コンセプト分離カーブ
arXiv cs.CL / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、文埋め込みの評価における重要な課題として、分類器に依存したテストでは性能が埋め込みそのものに起因するのか、下流分類器の振る舞いに起因するのかが不明確になる点を指摘しています。
- 記事では、統制された統語ノイズと意味の否定を文に投入し、埋め込みに対する相対的な影響を測ることで、分類器に依存しない評価手法を提案しています。
- 著者らは、概念的な変化と表層的な変化をモデルがどれだけ切り分けられるかを可視化する「コンセプト分離カーブ(Concept Separation Curves)」を提案しています。
- 複数領域のデータ、オランダ語と英語、さらに文長の違いを含む実験により、この手法が異なる埋め込みモデル間で、解釈可能かつ再現可能な形で概念の安定性を評価できることを示しています。



