Multilingual KokoroChat: 多言語カウンセリング対話データセット作成のためのマルチLLMアンサンブル翻訳手法

arXiv cs.CL / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • Multilingual KokoroChatは、大規模な手作業で作成された日本語のカウンセリング対話コーパス(KokoroChat)を英語および中国語に翻訳し、高品質な公開カウンセリングデータの入手可能性が限られていることへの対処を目的とした新しいデータセットである。
  • 翻訳品質は入力に依存し、単一のLLMが一貫して常に最良になるとは限らないため、著者らは機微な領域における高忠実度の出力に合わせて調整されたマルチLLMアンサンブル翻訳パイプラインを提案する。
  • この手法は複数の異なるLLMを用いて多様な翻訳仮説を生成し、その後、別のLLMが仮説間の長所と短所を分析することで、最終的な翻訳を選択し精緻化する。
  • 人手による嗜好評価実験により、アンサンブル手法による翻訳は、いかなる単体の最先端LLMが生成した翻訳よりも好まれることが検証されており、忠実度の向上が示されている。
  • このデータセットはGitHub上で公開されており、研究者がより高品質な学習素材を用いて多言語カウンセリング対話システムを構築・評価できるようになっている。

Abstract

高品質で公開可能なカウンセリング対話データセットの重大な不足に対処するため、私たちは大規模に手作業で著された日本語のカウンセリング・コーパスであるKokoroChatを、英語および中国語の両方に翻訳することで、多言語対応のMultilingual KokoroChatを作成しました。このプロセスにおける重要な課題は、翻訳のための最適なモデルが入力によって異なるため、単一のモデルが一貫して最高品質を保証できないことです。カウンセリングという機微な領域では、可能な限りの翻訳忠実度が不可欠であるため、したがって単一のLLMに依存するだけでは不十分です。この課題を克服するため、私たちは新しいマルチLLMアンサンブル手法を開発し、これを用いました。私たちの手法はまず、複数の異なるLLMから多様な仮説を生成します。次に、単一のLLMが、提示されたすべての仮説のそれぞれの長所と短所の分析に基づいて、高品質な翻訳を生成します。\`\`Multilingual KokoroChat\`\`の品質は、人手による嗜好(好み)評価研究によって厳密に検証されました。これらの評価により、アンサンブル手法によって生成された翻訳が、任意の単一の最先端LLMによって生成された翻訳よりも好まれることが確認されました。この強い選好は、私たちの手法の出力がより優れていることを裏付けています。Multilingual KokoroChatは https://github.com/UEC-InabaLab/MultilingualKokoroChat で公開されています。