言語の複雑系としての文脈表現における、乱流のような 5/3 スペクトルスケーリング

arXiv cs.CL / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、トークン化されたテキストを、トランスフォーマー言語モデルによって生成される高次元埋め込み空間上の軌道（トラジェクトリ）として扱い、埋め込みステップ信号を用いて系列方向のゆらぎを解析する。

Abstract

自然言語は、頑健な統計的規則性を示す複雑なシステムである。ここでは、トランスフォーマ型言語モデルによって生成される高次元の埋め込み空間における軌跡としてテキストを表し、埋め込みステップ信号を用いてトークン列に沿ったスケール依存のゆらぎを定量化する。複数の言語およびコーパスにわたって得られるパワースペクトルは、拡張された周波数範囲にわたり、指数が

5/3

に近い頑健なべき乗則を示す。このスケーリングは、人間が執筆したテキストとAIが生成したテキストの双方の文脈埋め込みにおいて一貫して観測されるが、静的な単語埋め込みでは観測されず、トークン順序のランダム化によって破壊される。これらの結果は、観測されたスケーリングが語彙統計だけではなく、多重スケールで文脈に依存した組織化を反映していることを示している。乱流におけるコルモゴロフ・スペクトルとの類推により、本研究の知見は、意味情報が言語スケール全体にわたってスケールフリーで自己相似的な方法で統合されていることを示唆しており、言語表現における複雑な構造を研究するための定量的でモデル非依存のベンチマークを提供する。

ザハ事務所出身の建築家、AI前提の設計法を実践設計者はキュレーターに

日経XTECH

安川電機、人型ロボをオフィスへフィジカルAIで「臨機応変」実現

日経XTECH

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日経XTECH

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

日経XTECH

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

日経XTECH

言語の複雑系としての文脈表現における、乱流のような 5/3 スペクトルスケーリング

要点

Abstract

関連記事

ザハ事務所出身の建築家、AI前提の設計法を実践設計者はキュレーターに

安川電機、人型ロボをオフィスへフィジカルAIで「臨機応変」実現

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

ザハ事務所出身の建築家、AI前提の設計法を実践 設計者はキュレーターに

安川電機、人型ロボをオフィスへ フィジカルAIで「臨機応変」実現

ソフトバンクG、フィジカルAIに名乗り 通信がロボにもたらす賢さと速さ

日立やNEC、フィジカルAIで脱「人月商売」 リアルな現場も効率化

日立やNEC、フィジカルAIで脱「人月商売」 リアルな現場も効率化

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ザハ事務所出身の建築家、AI前提の設計法を実践設計者はキュレーターに

安川電機、人型ロボをオフィスへフィジカルAIで「臨機応変」実現

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化

日立やNEC、フィジカルAIで脱「人月商売」リアルな現場も効率化