グラフェム依存から語彙構造へ:ダンテ『神曲』をマルコフ的視点で捉える
arXiv cs.CL / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究は、ダンテ『神曲』を母音・子音(V/C)記号で符号化し、その系列を4状態のマルコフ連鎖としてモデル化することで、作品の構造的な編成を調べます。
- 「グラフェム記憶」指数を提案し、InfernoからParadisoにかけてこの指数がわずかに、しかし一貫して増加することを示し、局所的な依存関係の構造が方向性をもって変化している可能性を示します。
- トライグラム分析により、この傾向は限られた反復的な設定(「グラフェム・プローブ」)によって支えられ、それがマルコフのパターンを本文中の識別可能な語彙環境に結び付けると解釈されます。
- プローブは、語境界をまたぐ場合と語彙内部にとどまる場合で異なる振る舞いを示し、さらにアポストロフィ付きの形などの正書法上の慣習が信号に影響することが示されます。
- 補完的な分類分析では、各カンティカに固有の語が語彙アンカーとして用いられ、3つのカンティカが分離されるだけでなく、作品全体を通じて連続的な軌跡としても現れることが明らかになります。



