HumorGen: パーソナベースの蒸留による大規模言語モデルにおけるユーモア生成のための認知シナジー
arXiv cs.CL / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- ユーモア生成は、標準的なLLMの学習では難しい。なぜなら次トークン予測は、コメディが依存する「驚き」や「不一致」を抑制してしまうからだ。
- 本論文では、「Cognitive Synergy Framework(認知シナジー・フレームワーク)」を提案する。これは、Mixture-of-Thoughtの仕組みを用い、心理学の理論に基づく6つのパーソナ(認知的観点)を設定することで、多様なユーモアデータを合成する。
- これらのパーソナによって理論的に裏付けられたデータセットを作成し、7Bパラメータの学生モデルを微調整する。
- 著者らは学習手法を比較し、自身の7Bモデルが、より大きな指示調整済みベースラインを強く上回り、最先端のプロプライエタリ(商用)モデルとも競争力のある性能を示すことを明らかにする。
- 本研究は、強いユーモア生成品質を達成するためには、アラインメント用のアルゴリズムや単なるモデル規模よりも、パーソナ主導の認知データキュレーションのほうが重要だと結論づける。




