低リソースのエンティティマッチングのための属性ガイダンス付きプロンプトチューニング

arXiv cs.AI / 2026/3/23

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • PROMPTATTRIB は、エンティティレベルのプロンプトと属性レベルのプロンプトの双方をファジィ論理と組み合わせて最終的なマッチングラベルを推定する、低リソースのエンティティマッチング手法である。
  • 本手法は、属性レベル情報を取り入れ、解釈性を高めることで、従来のプロンプトチューニングによるエンティティマッチング研究の限界に対処する。
  • SimCSE に触発され、ソフトプロンプト上でドロップアウトベースの対照学習を導入し、限られたラベル付きデータ下でのエンティティマッチング(EM)性能を向上させる。
  • 複数のデータセットにまたがる実世界の実験は、PROMPTATTRIB の有効性を示し、最小限の監視で精度を向上させ、低リソースの EM タスクへの実用的適用性を示唆する。

要約: Entity Matching (EM) は、同一、異なる、未決定など、2つのエンティティ間の論理的関係を決定する重要なタスクです。従来の EM アプローチは教師あり学習に大きく依存しており、高品質のラベル付きデータを大量に必要とします。このラベリングプロセスは時間がかかり、費用もかさむため、実用性を制限します。その結果、最小限のラベルデータで良好な性能を発揮できる低リソースの EM 手法が強く求められています。近年のプロンプトチューニング手法は低リソースの EM に有望性を示していますが、主にエンティティレベルのマッチングに焦点を当て、重要な属性レベルの情報を見落とすことが多いです。さらに、これらの手法は通常、解釈性や説明可能性を欠きます。これらの制限に対処するため、本論文は属性レベルのプロンプトチューニングと論理推論を通じて EM に取り組む総合的な解決策である PROMPTATTRIB を提案します。PROMPTATTRIB は、より豊かな文脈情報を取り入れるためにエンティティレベルと属性レベルのプロンプトの両方を使用し、ファジィ論理式を用いて最終的なマッチングラベルを推定します。属性を明示的に考慮することにより、モデルはエンティティをより深く理解し、より正確なマッチングを実現します。さらに、PROMPTATTRIB は SimCSE に触発されたソフトプロンプト上のドロップアウトを用いた対比学習を統合し、EM の性能をさらに向上させます。実世界のデータセットを用いた広範な実験により、PROMPTATTRIB の有効性が示されています。