要旨: 大規模言語モデル(LLMs)は、多様な人間の行動や人格を模倣する際に顕著な能力を示してきました。しかし、プロンプトエンジニアリングと標準的な教師付き微調整(SFT)を含む人格制御の既存の手法は、人格特性を離散的なカテゴリとして扱いがちで(例: 「外向的」対「内向的」)、特性の強さを連続的なスペクトラムで正確に制御する能力を欠いています。本論文では、LLMにおける細粒度かつ連続的な人格制御の新しい枠組み「Fusian」を提案します。Fusianは二段階で動作します: (1) 軌跡の収集、SFT中の人格採用の動的進化を、LoRAアダプターの連続列を保存することで捉え、特性の連続的多様体を実質的にマッピングします; (2) RLベースの動的融合、ここでは強化学習を用いて方策ネットワークを訓練し、これらの凍結済みアダプターの混合重みを動的に計算します。方策ネットワークでパラメータ化されたディリクレ分布からサンプリングすることにより、Fusianは複数のアダプターを融合させ、モデルの出力を特定の数値目標強度に合わせます。Qwen3-14Bモデルでの実験は、Fusianが人格制御において高精度を達成し、ユーザー指定の特性強度に整合させる際にベースライン手法を大幅に上回ることを示しています。
返却形式: {"translated": "翻訳されたHTML"}