小規模言語モデルエージェントの感情に敏感な意思決定について

arXiv cs.AI / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、小規模言語モデル(SLM)エージェントにおいて、プロンプトベースの手法のみに頼るのではなく、表現レベルで感情状態を誘発することで、感情が因果的に意思決定にどのように影響するかを調べる。
  • 群衆によって妥当性確認された、現実世界の感情喚起テキストに基づく活性ステアリングを用い、制御可能で転用可能な感情介入を作り出す。
  • 著者らは、完全情報と不完全情報の双方のもとで、協調的・競争的な誘因をカバーする意思決定テンプレートを含むゲーム理論的ベンチマークを導入し、それを戦略的シナリオや多様なペルソナにわたって実装する。
  • 複数のモデルファミリとモダリティにまたがる実験により、感情による摂動が戦略的な選択を確実に変えることが分かるが、その結果として生じる振る舞いは不安定になり得て、人間の期待と部分的にしか一致しない。
  • 本研究は、感情に駆動された表現摂動に対するSLMエージェントの頑健性を改善することを目指したアプローチを提案する。

要旨: 小型言語モデル(SLM)は、対話的な意思決定エージェントとしてますます利用されているが、意思決定に焦点を当てた評価の多くは、行動に影響を与える因果要因としての感情を無視している。本研究では、表象レベルでの感情誘導と、構造化されたゲーム理論的評価を組み合わせることで、感情に敏感な意思決定を探究する。感情状態は、クラウドで検証された現実世界の感情喚起テキストから導出したアクティベーション・ステアリングを用いて誘導し、プロンプトベースの手法を超えた、制御可能で移植可能な介入を可能にする。協力的・競争的なインセンティブの双方を、完全情報および不完全情報の両方のもとで扱う、基本的な意思決定テンプレートに基づくベンチマークを提案する。これらのテンプレートは、 extsc{Diplomacy}、 extsc{StarCraft II}、および多様な現実世界の人物像からの戦略的シナリオを用いて具体化する。さまざまなアーキテクチャとモダリティにまたがる複数のモデルファミリに対する実験により、感情による摂動が戦略的な選択に体系的に影響することが示される一方で、得られる振る舞いはしばしば不安定であり、人間の期待と完全には一致しない。最後に、感情に起因する摂動への頑健性を改善するためのアプローチを概説する。