HumorGen: パーソナベースの蒸留による大規模言語モデルにおけるユーモア生成のための認知シナジー

arXiv cs.CL / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

ユーモア生成は、標準的なLLMの学習では難しい。なぜなら次トークン予測は、コメディが依存する「驚き」や「不一致」を抑制してしまうからだ。
本論文では、「Cognitive Synergy Framework（認知シナジー・フレームワーク）」を提案する。これは、Mixture-of-Thoughtの仕組みを用い、心理学の理論に基づく6つのパーソナ（認知的観点）を設定することで、多様なユーモアデータを合成する。
これらのパーソナによって理論的に裏付けられたデータセットを作成し、7Bパラメータの学生モデルを微調整する。
著者らは学習手法を比較し、自身の7Bモデルが、より大きな指示調整済みベースラインを強く上回り、最先端のプロプライエタリ（商用）モデルとも競争力のある性能を示すことを明らかにする。
本研究は、強いユーモア生成品質を達成するためには、アラインメント用のアルゴリズムや単なるモデル規模よりも、パーソナ主導の認知データキュレーションのほうが重要だと結論づける。