要約(アブストラクト)とハイライトを統合して学術論文からの教師なしキーワード抽出を強化する
arXiv cs.CL / 2026/4/22
💬 オピニオンModels & Research
要点
- 本論文は、学術論文の「ハイライト」セクションを取り込むことで、アブストラクトのみの場合よりも教師なしキーワード抽出を改善できるかを調査している。
- 著者らは、アブストラクトのみ/ハイライトのみ/アブストラクト+ハイライトの組み合わせという3つの入力条件を、4つの教師なしモデルで評価している。
- Computer Science(CS)およびLibrary and Information Science(LIS)のデータセットでの実験により、アブストラクトとハイライトを統合するとキーワード抽出性能が有意に向上することが示されている。
- アブストラクトとハイライトの間で、キーワードのカバレッジや内容にどのような違いがあり、それが抽出結果にどう影響するかも分析している。
- 著者らは、提示されたGitHubリポジトリを通じてデータとコードを公開し、再現性とさらなる研究を促進している。



