大規模言語モデルにおける「口癖(verbal tics)」の台頭:フロンティアモデル横断の体系的分析
arXiv cs.CL / 2026/4/22
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、8つの主要なフロンティアLLMにまたがって、「verbal tics」(反復的で定型的な言語パターン)が増加していることを体系的に報告しており、褒め言葉で始めるお世辞的な導入、疑似的な共感の肯定、過度に使われる語彙などが確認されます。
- APIベースの独自評価フレームワークを用い、英語と中国語で10,000件のプロンプトを10カテゴリのタスクにわたって実施し、合計160,000の応答を収集したうえで、口癖の出現頻度を定量化する「Verbal Tic Index(VTI)」を提案しています。
- モデル間で大きな差が見られ、Gemini 3.1 Proが最も高いVTI(0.590)を示し、一方でDeepSeek V3.2が最も低いVTI(0.295)でした。
- 口癖は多ターン会話で蓄積しやすく、主観的タスクで強調され、また言語をまたいだ形にも特徴的なパターンがあることが示されています。
- 人手評価(N=120)では、お世辞(sycophancy)と「自然さ」の知覚に強い逆相関(r = -0.87、p < 0.001)が確認され、現在の学習パラダイムにおける「alignment tax」の考え方を裏づけています。



