対比のコードを解読する:AIモデルはユーモラスな矛盾を理解できるのか

arXiv cs.CL / 2026/4/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、大規模なマルチモーダル(視覚-言語)モデルが、対比や矛盾した、非線形のナラティブ(物語)手がかりに依存する人間のユーモアをどのように扱うかを検討する。
  • 2コマ漫画を用いてユーモラスな矛盾を生み出す「YesBut」ベンチマークを導入し、課題は文字通りの解釈から、より深い物語推論にまで及ぶ。
  • 複数の最先端の商用およびオープンソースの大規模視覚言語モデルを対象とした実験の結果、現在のシステムは、これらのユーモア/対比タスクにおいて人間の性能に依然として及ばないことが分かる。
  • 本研究は、創造的な人間表現における物語の相互作用をAIがモデリングする際の、具体的な制約に関する診断的な洞察を提供し、そのような推論を改善するための今後の方向性を示唆する。