LLM表現における修辞疑問:線形プロービング研究
arXiv cs.CL / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本研究は、異なる談話文脈をもつ2つのソーシャルメディア・データセットに対して線形プロービングを適用することで、大規模言語モデルが修辞疑問と情報探索型の疑問をどのようにエンコードしているかを調査する。
- 修辞的なシグナルはモデル表現内の早い段階に現れ、最も一貫して「最後のトークン」特徴によって捉えられ、修辞疑問は各データセット内において情報探索型の疑問と線形分離可能になることが分かる。
- データセット間の転移により、修辞疑問の検出は実行可能なままであり、AUROCはおよそ0.7〜0.8を達成する。これは、有用なシグナルがある程度一般化することを示している。
- 転移性能が中程度であるにもかかわらず、本論文は「転移可能性」が単一で共有された表現を意味するわけではないことを示す。すなわち、異なるデータセットで訓練されたプローブは、同一のターゲット・コーパスに対して得られるランキングが大きく異なる。
- 定性的分析では、こうしたプローブの相違は、長い議論にまたがる談話レベルの立場(stance)といったものに加えて、より局所的で構文に基づく疑問を示す手がかりなど、複数の基底となる修辞的現象に起因するとしている。




