Abstract
メンタルヘルス支援への需要の高まりにより、カウンセリングに大規模言語モデル(LLM)を用いることへの関心が高まっている。 しかし、このような高リスクで安全性が重要な領域にLLMを適応させることは、プライバシー制約のために実世界のカウンセリングデータが乏しいことによって妨げられている。 合成データセットは有望な代替手段を提供するが、既存のアプローチの多くは、非構造または半構造のテキスト入力に依存しているうえ、クライアントの認知・感情・行動状態の間に存在する構造的な依存関係を見落としており、その結果として心理的に一貫しないやり取りが生じやすく、データの現実性と品質が低下する。 我々は、クライアント心理グラフ(Client Psychological Graphs: CPG)に基づいて合成カウンセリングセッションを生成する枠組みGraph2Counselを提案する。 CPGは、クライアントの思考、感情、行動の間の関係を符号化する。 Graph2Counselは、カウンセラーの戦略とCPGによって導かれる構造化プロンプトのパイプラインを用い、CoT(Wei et al., 2022)やマルチエージェントフィードバック(Li et al., 2025a)を含むプロンプト戦略を検討する。 Graph2Counselは、多様なクライアントプロファイルにわたる76個のCPGから760セッションを生成する。 専門家による評価では、我々のデータセットは、先行データセットに比べて、具体性、カウンセラーの能力、真正性、会話の流れ、安全性の面で優れており、さらに実質的なアノテータ間一致が得られている(Krippendorffのalpha = 0.70)。 このデータセットでオープンソースモデルをファインチューニングすると、CounselingBench(Nguyen et al., 2025)およびCounselBench(Li et al., 2025b)で性能が向上し、下流タスクでの有用性が示される。 また、コードとデータを公開する。