AI Navigate

Fusian: 大規模言語モデルにおける細粒度かつ連続的なMBTI性格制御のための複数のLoRAを用いた融合

arXiv cs.CL / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Fusian は、LLMs における細粒度かつ連続的な人格制御のための二段階フレームワークを提案します。まず SFT 中に LoRA アダプターの軌跡を収集し、特性の連続的マニフォールドを写像します。
  • 第二段階では、強化学習ポリシーがディリクレ分布からサンプリングして複数の凍結済みアダプターを動的に融合し、ターゲット特性の強度へと到達します。
  • Qwen3-14B モデルでの実験では、Fusian がユーザー指定の人格強度と高い精度で一致することを達成し、ベースライン手法を上回ることを示しています。
  • このアプローチは離散的なカテゴリを超えた連続的でニュアンスに富む人格制御を可能にし、よりパーソナライズされ、制御可能なアシスタントとの対話へと寄与する可能性があります。

要旨: 大規模言語モデル(LLMs)は、多様な人間の行動や人格を模倣する際に顕著な能力を示してきました。しかし、プロンプトエンジニアリングと標準的な教師付き微調整(SFT)を含む人格制御の既存の手法は、人格特性を離散的なカテゴリとして扱いがちで(例: 「外向的」対「内向的」)、特性の強さを連続的なスペクトラムで正確に制御する能力を欠いています。本論文では、LLMにおける細粒度かつ連続的な人格制御の新しい枠組み「Fusian」を提案します。Fusianは二段階で動作します: (1) 軌跡の収集、SFT中の人格採用の動的進化を、LoRAアダプターの連続列を保存することで捉え、特性の連続的多様体を実質的にマッピングします; (2) RLベースの動的融合、ここでは強化学習を用いて方策ネットワークを訓練し、これらの凍結済みアダプターの混合重みを動的に計算します。方策ネットワークでパラメータ化されたディリクレ分布からサンプリングすることにより、Fusianは複数のアダプターを融合させ、モデルの出力を特定の数値目標強度に合わせます。Qwen3-14Bモデルでの実験は、Fusianが人格制御において高精度を達成し、ユーザー指定の特性強度に整合させる際にベースライン手法を大幅に上回ることを示しています。

返却形式: {"translated": "翻訳されたHTML"}