概要: 本研究では、象徴的時系列解析とマルコフモデリングを適用し、グラフェム(文字)に基づく母音/子音(V/C)符号化によって捉えられたエヴゲニイ・オネーギンの音韻的構造と、現代のイタリア語訳の2つを探索する。マルコフの元来の方式に着想を得た2値符号化を用いて、局所的なV/C依存関係と大域的な逐次パターンの両方を捉える最小限の確率モデルを構築する。4状態のコンパクトなマルコフ連鎖が記述的に正確であり、かつ生成的でもあることが示されており、自己相関や記憶の深さといった元の系列の重要な特徴を再現する。本研究の結果はすべて探索的な性質のものであり、基礎にある物語のダイナミクスについての仮説を示唆しつつ、構造的な規則性を強調することを目的としている。
分析の結果、ロシア語本文とイタリア語訳の間に顕著な非対称性が明らかになった。原文では記憶の深さが徐々に低下していくのに対し、翻訳ではより均一なプロファイルが維持されている。こうした相違をさらに調べるために、音韻プローブ—表層構造を物語に関連する手がかりへ結びつける短い象徴的パターン—を導入する。展開していく本文の中で追跡すると、これらのプローブは、特にロシア語原文において、グラフェム的な形と主題の発展との間に、微妙なつながりがあることを示す。
文学テキストに象徴的解析を適用するというマルコフの元来の提案を改めて検討し、それを計算統計やデータサイエンスからの現代的な手法と組み合わせることで、本研究は、最小限のマルコフモデルであっても複雑な詩的素材の探索的解析を支えることができることを示す。さらに、粗い言語注釈の層を補完することで、こうしたモデルは比較詩学のための一般的な枠組みを提供し、言語形式に基づく単純な表現を通じて、様式化された構造パターンが依然として到達可能であることを示す。
マルコフがプーシキンを読み直す:エフゲニイ・オネーギンの詩的世界を統計的に旅する
arXiv cs.CL / 2026/4/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究は、エフゲニイ・オネーギンの音韻構造を、グラフェムの母音/子音(V/C)符号化によって捉え、象徴的な時系列解析とマルコフモデリングで分析し、あわせて同時代のイタリア語訳も対象にしています。
- コンパクトな4状態マルコフ連鎖が、記述の正確さと生成能力の両面で有効であり、自己相関や記憶の深さといったV/C系列の特徴を再現できると示されています。
- ロシア語原文とイタリア語訳の間には非対称性が見られ、ロシア語では記憶の深さが徐々に低下する一方、訳文ではより一様なプロファイルが保たれることが明らかになっています。
- この差異をさらに検討するために、表層のグラフェム的パターンと物語に関わる手がかりを結びつける「音韻プローブ」を導入し、テキストの展開に沿って調べています。
- 総じて、粗い言語注釈と組み合わせれば、最小限のマルコフモデルでも詩の言語に潜む構造的規則性を可視化し、比較の詩学を探索的に支援できると提案しています。




