要旨: パーソナライズされた大規模言語モデル(LLM)は、人間中心のアプリケーションにおいて、より自然で人間らしい対話を促進します。しかし、既存のパーソナライズ手法は、制御性が限られていることや計算資源の要求が大きいことによって制約されています。さらに、静的なパーソナリティモデリングへの依存は、状況が変わる中での適応力を制限します。これらの制限に対処するために、まず、ペルソナ・ニューロンの多視点分析を通じて、LLMのパーソナリティの中に、状況依存性と一貫した状況—行動パターンが存在することを示します。これらの知見に基づき、先進的な状況に応じたパーソナリティ・ステアリングのための、訓練不要のニューロンベース「Identify-Retrieve-Steer(識別・検索・操舵)」フレームワークであるIRISを提案します。本手法は、状況に応じたペルソナ・ニューロンの識別、状況を考慮したニューロンの検索、類似度で重み付けした操舵から構成されます。実験的に、PersonalityBenchおよび新たに導入した包括的な状況パーソナリティ・ベンチマークであるSPBench上で、我々のフレームワークを検証します。実験結果は、本手法が最良のベースラインを上回り、複雑で未知の状況や異なるモデルのアーキテクチャに対するIRISの汎化性能と頑健性を示しています。
静的なパーソナの先へ:大規模言語モデルにおける状況に応じた性格(パーソナリティ)制御
arXiv cs.CL / 2026/4/16
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、現在のパーソナライズされたLLMアプローチが、制御性の低さ、計算コストの高さ、そして異なる状況への適応がうまくできない静的なパーソナモデリングへの依存によって制限されていると主張する。
- 「パーソナ・ニューロン」のマルチ視点分析により、LLMの性格は状況依存ではあるが一貫した挙動パターンを示すことを裏付ける証拠を提示する。
- 学習不要のニューロンベース手法であるIRISを導入する。IRISは、状況に関連するパーソナ・ニューロンを特定し、状況を考慮した形でそれらを検索(リトリーブ)し、類似度で重み付けした制御(ステアリング)を適用するIdentify–Retrieve–Steerフレームワークである。
- 本手法は、新しいベンチマークであるPersonalityBenchおよびSPBench(状況に応じたパーソナリティのシナリオを扱う)で評価され、強力なベースライン手法を上回ると報告される。
- 結果は、IRISがより良く一般化でき、複雑で未知の状況だけでなく、異なるモデルアーキテクチャ間でも頑健性を維持することを示している。




