要旨: ほとんどの固有の関連性プローブは語彙、文、またはコーパスレベルで動作し、著者レベルの変動を覆い隠してしまう。私たちはPOLAR(Per-user On-axis Lexical Association Report)を提示する。これは軽く適応させたマスクド言語モデルの埋め込み空間で実行される個々のユーザー向け語彙連関検査である。著者は private deterministic トークンによって表される;POLARはこれらのベクトルを精選された語彙軸へ射影し、置換p値とBenjamini–Hochberg法による多重検定補正のもと標準化された効果を報告する。バランスのとれたボット対人間のTwitterベンチマークでは、POLARはLLM駆動のボットを有機アカウントから明確に分離する。過激派フォーラムでは、それが蔑称語の語彙リストとの強い整合を定量化し、時間とともに右寄りの傾向が現れることを明らかにする。本手法は新しい属性セットに対してモジュール化可能で、計算機社会科学のための簡潔な著者別診断を提供する。すべてのコードは https://github.com/pedroaugtb/POLAR-A-Per-User-Association-Test-in-Embedding-Space で公開されています。
POLAR: 埋め込み空間におけるユーザーごとの連想検定
arXiv cs.CL / 2026/3/18
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- POLAR(Per-user On-axis Lexical Association Report)は、軽く適応させたマスクド言語モデルの埋め込み空間で動作し、著者レベルの変動を明らかにするユーザー別の語彙連想検査を導入する。
- 著者は著者ごとに割り当てられたプライベートで決定論的なトークンによって表され、POLARはこれらのベクトルを厳選された語彙軸に射影し、置換p値と Benjamini–Hochberg 補正を用いた標準化効果を報告する。
- バランスの取れたボット対ヒトのTwitterベンチマークでは、POLARはLLM由来のボットと有機的アカウントを明確に分離し、過激派フォーラムでは侮蔑語辞典との強い整合性を定量化し、時間とともに右寄りへ傾く傾向を示す。
- 本手法は新たな属性セットに対してモジュラーであり、計算機社会科学の著者別診断を簡潔に提供し、コードはすべて公開されている。