LLMが生成したテキストにおける時間的フラット化:人間とLLMの執筆軌跡の比較
arXiv cs.CL / 2026/4/15
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMが、ステートレスまたは履歴に条件付けされた対話設定にデプロイされた場合に、長い時間スパンにわたる人間の執筆の「軌跡(trajectory)」を再現できるかどうかを調査する。
- 2012〜2024年にわたり、学術要旨、ブログ、ニュースの計6,086文書を、412人の人間著者について収集した公開済みの縦断(ロングテール)データセットを導入し、3つの代表的なLLMを用いて比較可能な軌跡を生成する。
- 意味、語彙、認知・情動の表現にわたるドリフトおよび分散の指標を用いることで、研究ではLLM出力に「時間的フラット化(temporal flattening)」が見られることを明らかにする。すなわち、LLMは人間に比べて時間の経過に伴う意味的変化および認知・情動的変化が小さい。
- LLM生成テキストは語彙的多様性が高い一方で、意味的および感情的なドリフトが抑えられているため、人間とLLMの軌跡を区別する上で時間的変動のパターンが非常に予測的である(精度94%、ROC-AUC 98%)。
- 著者らは、モデルが逐次的な履歴を用いていても、この時間的フラット化のギャップが持続することを結論づけており、合成学習データの品質や、縦断的テキストモデリングへの影響を示している。




