ナラティブ・フィンガープリンツ:新規性カーブのダイナミクスによるマルチスケール著者同定
arXiv cs.CL / 2026/4/3
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、情報理論的な「新規性カーブ」の測定可能なパターンから、個々の著者を特定できるかどうかを検討する。
- Books3 と PG-19 を用いて、マルチスケールの著者シグナルを報告する。すなわち、書籍レベルのスカラーな新規性ダイナミクスは、偶然を超えて 43% の著者を同定できる一方で、スライディングウィンドウに基づく章レベルの SAX モチーフ・パターンでは、はるかに強い帰属(attribution)が得られる。
- 研究では、書籍レベルと章レベルのシグナルは冗長というより補完的であり、テキスト構造の異なる階層が、著者に固有な情報をそれぞれ異なる形で持つことを示唆している。
- 帰属シグナルはジャンルによって部分的に混同されるが、ジャンル内でも約 4 分の 1 の著者についてはなお検出可能であることを示す。
- 本効果が単なる現代的なフォーマットのアーティファクトではないことを、トウェイン、オースティン、キプリングのような著者で同等のフィンガープリント強度が観測される点から論じている。




