ボイスは改稿中：大規模言語モデルと個人的ナラティブの“正規化”

arXiv cs.CL / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、3つの最先端LLMで300の個人的ナラティブを書き換え、さまざまなプロンプト条件下で「文体」や「物語の質感」がどう変わるかを分析する。
モデルや条件が異なっても、書き換えは一貫して「文体の正規化（スタイリスティック・ノーマライゼーション）」を促し、機能語・縮約・一人称代名詞は減る一方で、語彙多様性・語長・句読点の精緻化は増える。
“声（ボイス）を保持する”ことを狙ったプロンプトでも変化は小さくなるが方向性は消えず、スタイロメトリクス分析では書き換え文が元文との照合を難しくする方向に特徴空間で収束する。
著者らは、デジタル・ヒューマニティーズや計算言語分析において、機能語・代名詞・縮約・句読点といったスタイル／声の手がかりが、元の作者性やコーパスの完全性をそのまま反映するとは限らなくなる点を指摘し、LLMによる改稿を単なる表面編集ではなくテキストの媒介として捉えるべきだと述べる。

要旨: 本研究は、大規模言語モデルによる書き換えが、個人的物語（パーソナル・ナラティブ）の文体と叙述の質感（ナラティブ・テクスチャ）をどのように変えるかを検討する。3つの最先端LLMが、3つのプロンプト条件（一般的な改善、書き換えのみ、声（ボイス）を維持する修正）下で書き換えた300の個人的物語を分析する。変化は、計算言語学的文体論（computational stylistics）から導かれた13の言語指標に基づいて測定する。これには、機能語、語彙の多様性、単語長、句読点、短縮形、一人称代名詞、感情語が含まれる。
モデル間およびプロンプト条件間で、LLMによる書き換えは、文体の正規化（スタイリスティック・ノーマライゼーション）に関して一貫したパターンを生み出す。すなわち、機能語、短縮形、一人称代名詞は減少する一方で、語彙の多様性、単語長、句読点の精緻化は増加する。これらの変化は、プロンプトがモデルに「改善」を求める場合でも、単に「書き換え」を求める場合でも生じる。声を維持するプロンプトは変化の大きさを抑えるが、その方向性までを完全には消し去らない。様式計量学（stylometric）分析は、書き換えられたテキストが特徴空間上で収束し、元のテキストへと照合し直すことがより難しくなることを示す。加えて、追加の物語指標は、埋め込まれた叙述から距離を置いた叙述への移行、ならびに明示的な因果的推論から圧縮された抽象化への転換を示している。
本結果は、現代的なLLMが、より洗練され、より位置づけ（situatedness）の弱いレジスターへと向かう方向性のある引力を及ぼすことを示唆する。これは、デジタル・ヒューマニティーズや計算テキスト分析において、機能語、代名詞、短縮形、句読点のような特徴がしばしば文体、声（ボイス）、著者性、コーパスの完全性の証拠として機能することに、影響を与える。したがって、LLMによる修正は単なる表層レベルの編集としてではなく、結果を伴う一種のテキスト媒介（テキスト・メディエーション）として理解されるべきである。