プラグマティクスが文化と出会う:文化に適応した作品記述生成と評価

arXiv cs.AI / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、埋め込まれたシンボルや物語に対する理解度が異なる、さまざまな文化的オーディエンスに向けて作品を説明する際に、言語モデルがオープンエンドのテキスト生成でどのように振る舞うかを研究する。
  • 「文化に適応した作品記述生成」という新しいタスクを導入し、意思決定ベンチマークを超えて文化的な馴染み(familiarity)とバイアスを明示的に測定することを目的とする。
  • このプラグマティクス的な状況における文化的コンピテンスを評価するために、著者らは文化に根ざした質問応答を用いた評価フレームワークを提案する。
  • 結果として、基盤モデルはわずかに適切な程度にとどまる一方で、「プラグマティック話者モデル」により、疑似的な聞き手の理解が最大8.2%向上することが示される。
  • 人手による評価でもこのアプローチが裏付けられ、高いプラグマティック・コンピテンスの出力ほど、理解の助けになるとして8.0%多く評価される。

要旨: 言語モデルは意思決定タスクにおいてさまざまな形の文化的バイアスを示すことが知られている一方で、オープンエンドなテキスト生成タスクにおける文化的な馴染み度(文化的ファミリアリティ)の程度については、ほとんどわかっていません。本論文では、文化的に適応した美術品説明生成というタスクを導入します。これは、作品に埋め込まれた文化的シンボルや物語への馴染み度が異なる、異なる文化グループの観客に向けて、モデルが美術品を説明するものです。この実用的な生成タスクにおける文化的な能力(コンピテンシー)を評価するために、文化的に根ざした質問応答に基づく枠組みを提案します。その結果、基礎モデルはこのタスクに対してわずかに適切であるにとどまることがわかりましたが、実用的話者モデルを用いることで、模擬的な聞き手の理解を最大8.2%改善できることが示されます。さらに、人手による調査により、実用的な能力がより高いモデルほど、理解のために8.0%多く役立つと評価されることが確認されます。