コンプライアンスの彼方へ:心理的クライアント・シミュレーションに挑むためのレジスタンスに基づく動機推論フレームワーク

arXiv cs.AI / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、カウンセリング訓練や評価において現行モデルが生みがちな不自然な過剰コンプライアンスという限界を克服するための、心理的クライアント・シミュレータ「ResistClient」を提案する。
  • シミュレートされた「挑戦的なクライアント行動」をクライアント抵抗(Client Resistance)理論に基づけ、外部の行動と内部の動機づけメカニズムを結び付ける2段階のフレームワーク「Resistance-Informed Motivation Reasoning(RIMR)」を用いる。
  • RIMRはまず、大規模で多様なクライアントプロフィールを対象とした抵抗志向の心理会話データセットRPCで教師ありファインチューニングを行い、コンプライアンス・バイアスを低減する。
  • 続いて応答の模倣を超えて、応答生成の前に、心理的に整合した動機の推論を行うようモデルを訓練する。動機の真正性と応答の一貫性について、プロセスを教師つきとする強化学習による共同最適化を行う。
  • 著者らは、自動評価および専門家による評価を広範に実施した結果として、チャレンジの忠実性、行動の妥当性、推論の整合性が改善したことを報告し、困難な状況下でのメンタルヘルス対話LLMの評価と最適化をより良く行える可能性を示している。

要旨: 心理クライアント・シミュレータは、カウンセラー養成研修者や心理LLMの訓練・評価に対する、スケーラブルな解決策として登場してきました。しかし既存のシミュレータには非現実的な過剰服従が見られ、その結果、カウンセラーは実地で一般的に遭遇する困難な行動への備えが不十分になっています。 このギャップを埋めるために、本論文では ResistClient を提案します。これは、クライアント抵抗理論(Client Resistance Theory)に基づく挑戦的なクライアント行動を、外部の行動とその背後にある動機づけメカニズムを統合することで体系的にモデル化します。 そのために、2段階の訓練フレームワークである Resistance-Informed Motivation Reasoning(RIMR)を提案します。まず、RIMR は、クライアント抵抗を指向した大規模心理会話データセット RPC 上での教師あり微調整により、コンプライアンス・バイアスを緩和します。RPC は、多様なクライアント像をカバーしています。 次に、表面的な応答の模倣を超えて、RIMR は応答生成の前に、心理的に首尾一貫した動機づけの推論をモデル化します。そして、プロセスを教師ありとする強化学習により、動機づけの真正性と応答の一貫性を共同で最適化します。 大規模な自動評価および専門家評価の結果から、ResistClient は、既存のシミュレータに比べて、挑戦性の忠実度、行動としての妥当性、推論の首尾一貫性のすべてにおいて大きく上回ることが示されます。さらに ResistClient は、困難な条件下での心理LLMの評価を容易にし、メンタルヘルス対話システムのための新たな最適化の方向性を提供します。