自然言語における情報の周期性を特定する
arXiv cs.CL / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自然言語が情報の符号化において周期的なパターンを持つかどうかを、サプライズ(驚き)に基づいて検討します。
- 「AutoPeriod of Surprisal(APS)」という手法を提案し、単一ドキュメントのサプライズ系列に対して標準的な周期性検出アルゴリズムを適用できるとしています。
- 複数のコーパスへの適用により、人間の言語のかなりの割合で情報の周期性が強い形で観測されることが示唆されます。
- さらに、文境界などの典型的なテキスト構造単位の分布から外れる新たな有意な周期が見つかり、調和回帰モデルによって裏付けられます。
- これらの周期性は、構造化された要因と、より長距離で作用する別の要因の双方による「結果」であると結論づけ、LLM生成テキストの検出への可能性も議論します。




