Claim2Vec:多言語類似性とクラスタリングのためのファクトチェック主張の埋め込み

arXiv cs.CL / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • Claim2Vecは、ファクトチェックの主張をベクトルとして表現する多言語埋め込みモデルとして提示され、主張のクラスタリングをより適切に支援することを目的とする。これは、主張のマッチング/検索よりも探索が進んでいない課題である。
  • 本モデルは、クラスタリングのための意味的埋め込み空間を改善するために、類似した多言語の主張ペアを用いたコントラスト学習により微調整される。
  • 3つの多言語主張クラスタリング用データセット、14のベースラインとなる埋め込みモデル、7つのクラスタリングアルゴリズムにまたがる実験の結果、Claim2Vecはクラスタリング性能を大きく向上させることが示され、ラベルの整合性や幾何学的構造を含む形で改善が確認された。
  • 著者らは、複数言語にまたがるクラスタは微調整の恩恵を受けることを見出しており、効果的なクロスリンガルな知識転移が行われていることを示唆している。