『The Order in the Horse's Heart』:LLM支援型スタイロメトリーによる現代文学における聖書的言及の発見事例
arXiv cs.CL / 2026/4/22
💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 本論文は、現代文学における聖書的言及を検出するためのLLM支援型スタイロメトリーのデュアルトラック手法を提案し、コーマック・マッカーシーの小説に適用する。
- ボトムアップ・トラックでは、キング・ジェームズ聖書と共通する希少語彙をIDF(逆文書頻度)に基づく埋め込みで特定し、候補となる箇所ペアをカスケード型LLMでレビューして意味の曖昧性を解消する。
- トップダウン・トラックでは、特定の単語や句に依存せずにLLMがマッカーシーの文体(レジスター)を読み取り、見逃されやすい微妙な言及を拾うことを狙う。
- この手法は、長文脈モデルによるクロスバリデーション(小説全体とKJVを一括で処理)と、既存研究との照合で検証され、全体で349件の言及を検出し、既知115件のうち62件(回収率54%)を再発見する。
- 著者らは、機械的な文字列類似分析と組み合わせたLLMの付加価値を示し、大規模コーパスにおける「間テクスト性」を統計的に研究する道を拓く可能性を論じる。



