POLAR: 埋め込み空間におけるユーザーごとの連想検定

arXiv cs.CL / 2026/3/18

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

POLAR（Per-user On-axis Lexical Association Report）は、軽く適応させたマスクド言語モデルの埋め込み空間で動作し、著者レベルの変動を明らかにするユーザー別の語彙連想検査を導入する。
著者は著者ごとに割り当てられたプライベートで決定論的なトークンによって表され、POLARはこれらのベクトルを厳選された語彙軸に射影し、置換p値と Benjamini–Hochberg 補正を用いた標準化効果を報告する。
バランスの取れたボット対ヒトのTwitterベンチマークでは、POLARはLLM由来のボットと有機的アカウントを明確に分離し、過激派フォーラムでは侮蔑語辞典との強い整合性を定量化し、時間とともに右寄りへ傾く傾向を示す。
本手法は新たな属性セットに対してモジュラーであり、計算機社会科学の著者別診断を簡潔に提供し、コードはすべて公開されている。

要旨: ほとんどの固有の関連性プローブは語彙、文、またはコーパスレベルで動作し、著者レベルの変動を覆い隠してしまう。私たちはPOLAR（Per-user On-axis Lexical Association Report）を提示する。これは軽く適応させたマスクド言語モデルの埋め込み空間で実行される個々のユーザー向け語彙連関検査である。著者は private deterministic トークンによって表される；POLARはこれらのベクトルを精選された語彙軸へ射影し、置換p値とBenjamini–Hochberg法による多重検定補正のもと標準化された効果を報告する。バランスのとれたボット対人間のTwitterベンチマークでは、POLARはLLM駆動のボットを有機アカウントから明確に分離する。過激派フォーラムでは、それが蔑称語の語彙リストとの強い整合を定量化し、時間とともに右寄りの傾向が現れることを明らかにする。本手法は新しい属性セットに対してモジュール化可能で、計算機社会科学のための簡潔な著者別診断を提供する。すべてのコードは https://github.com/pedroaugtb/POLAR-A-Per-User-Association-Test-in-Embedding-Space で公開されています。

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

日経XTECH

POLAR: 埋め込み空間におけるユーザーごとの連想検定

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer