SC-Taxo:大規模言語モデルを用いた意味的一貫性制約下での階層的タクソノミー生成

arXiv cs.CL / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、科学文献の自動タクソノミー生成が、階層レベル間での構造的不整合や意味の不一致によって妨げられていると指摘する。
  • その主な原因は「階層的な意味的一貫性」のモデリング不足にあるとしており、これを解決するためのSC-Taxoを提案する。
  • SC-Taxoは、大規模言語モデルに階層を意識したリファインメント段階を組み込み、ボトムアップの抽象化とトップダウンの意味制約を同時に行う双方向の見出し生成を導入する。
  • さらに、同一階層深さにある要素間の意味的依存(ピアレベルの依存)も捉えることで、水平一貫性を高める。
  • 複数のベンチマークで階層整合性と見出しの質の改善が示され、加えて中国語の科学文献での評価によりクロスリンガルな頑健性も確認された。