要旨: 文中のコヒーレンス(まとまり)をモデル化することは、長い間NLP研究者を惹きつけてきた課題である。これは、非コヒーレントな構造を検出することや、著者がそれらを修正するのを助けることに応用できる。近年では、ニューラルネットワークを用いて1つの文からスケルトン(骨格)を抽出し、そのスケルトンを用いて次の文を生成することで、コヒーレントな物語を生成する取り組みが行われている。このプロジェクトでは、後続する文どうしにおけるスケルトンの一貫性が、あるまとまりのある文章(テキスト)のコヒーレンスを特徴づける良い指標になり得るかどうかを検討することを目指す。対となる2つの文の組にわたってコヒーレンスをモデル化するための、新しいSentence/Skeleton Similarity Network(SSN)を提案し、このネットワークが、コサイン類似度やユークリッド距離といったベースラインの類似度手法よりも大幅に優れていることを示す。スケルトンはコヒーレンスをモデル化する有望な候補に見えるが、本研究の結果は、テキストのコヒーレンス評価において、スケルトン上のモデルよりも文レベルのモデルのほうが優れていることを示している。これは、現状の最先端のコヒーレンス・モデリング手法が、文とその部分のサブ構成ではなく文を扱うことで正しい方向に進んでいることを示唆するものである。
物語におけるスケルトンベースの一貫性モデリング
arXiv cs.AI / 2026/4/6
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、隣接する文から抽出された「文スケルトン」の一貫性が、物語の一貫性を評価するための信頼できる指標になり得るかを調査する。
- 文/スケルトンのペアから一貫性をモデル化するために Sentence/Skeleton Similarity Network(SSN)を提案し、SSNがコサイン類似度やユークリッド距離といった単純なベースラインの類似度指標よりも優れていることを報告する。
- スケルトン表現の可能性が示される一方で、著者らは、一貫性評価においては文レベルの一貫性モデルの方がスケルトンベースのアプローチよりも優れることを見出す。
- これらの結果は、現在のNLPにおける一貫性モデリングの進展が、スケルトンのようなサブコンポーネントに主に依存するのではなく、完全な文を用いることと整合していることを示唆している。
