OMIND：知識に基づくファインチューニングとメンタルヘルス向けLLMのためのマルチターン対話ベンチマークのためのフレームワーク

arXiv cs.CL / 2026/3/27

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、メンタルヘルス領域でLLMを適応させる際の主要な障壁を特定している。具体的には、高品質で解釈可能な、知識に基づくトレーニングデータの不足、限られた学習パラダイム、そしてマルチターン対話設定に対する評価の弱さが挙げられる。
メンタルヘルスに特化したLLMエージェントのための、知識に基づくファインチューニングおよびアライメントを行う「oMind」フレームワークを提案し、多様な会話能力を対象としている。
著者らは、構造化された知識検索、LLMベースのプルーニング、そして品質向上のための人手によるレビューを用いた生成パイプラインにより、大規模なマルチタスクSFTデータセット（約164k）を導入する。
また、ターン単位と会話全体の両方で専門家によるアノテーションを行った新しいマルチターンベンチマーク「oMind-Chat」を公開し、より現実的な評価を支援する。
実験結果では、oMindで調整したモデルが主要能力や会話タスクにおいてベースラインを上回ることが報告されており、特にoMind-LLMは推論性能が向上している（最大で勝率80%）。