BANGLASOCIALBENCH: バングラデシュの社会的交流におけるLLMsの社会語用論および文化的適合性を評価するベンチマーク

arXiv cs.CL / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

BANGLASOCIALBENCHは、事実の想起ではなく、文脈依存的な言語使用に焦点を当てることによって、ベンガル語における社会語用論的能力を評価する初のベンチマークである。
3つの領域にまたがり、ベンガル語の呼称表現、親族関係の推論、社会習慣を対象とし、ネイティブのベンガル語話者によって作成・検証された1,719件の文化的に根ざした事例から成る。
12の現代的LLMsをゼロショット設定で評価したところ、過度に形式的な呼称表現など、複数の社会的に受け入れられる代名詞を認識できないといった、文化的ミスマッチの体系的パターンが明らかになった。
結果は、社会語用論的な失敗が無作為ではなく組織化されたパターンを示しており、現状のLLMsが現実的なバングラデシュの社会的相互作用において、文化的に適切な言語を推測・適用する際の継続的な制約を浮き彫りにしている。

要旨: 大規模言語モデルは高い多言語流暢さを示してきたが、流暢さだけでは社会的に適切な言語使用を保証するものではない。高コンテキスト言語においては、コミュニケーション能力は日常言語に直接組み込まれた社会的階層、関係的役割、および対話規範に対する感受性を必要とする。ベンガル語は、三層構造の代名詞体系、親族関係に基づく呼称、そして文化的に埋め込まれた社会慣習を通じてこの課題を体現している。BANGLASOCIALBENCHを紹介します。これは、事実の記憶ではなく文脈依存の言語使用を通じて、ベンガル語の社会語用能力を評価する最初のベンチマークです。このベンチマークは、三つの領域にまたがります：ベンガル語のアドレス用語、親族関係の推論、社会慣習、そして母語話者のベンガル語話者によって作成・検証された1,719の文化的に根ざした事例から成ります。私たちはゼロショット設定で十二の現代的なLLMを評価し、文化的ずれの体系的パターンを観察します。モデルはしばしば過度にフォーマルな呼称形式にデフォルトし、複数の社会的に受け入れられる呼称代名詞を認識できず、宗教的文脈全体で親族用語を混同します。私たちの知見は、社会語用的な失敗がしばしば構造化され、非ランダムであることを示しており、現代のLLMが現実的なバングラデシュの社会的相互作用における文化的に適切な言語使用を推測・適用する方法には持続的な限界があることを明らかにしています。

テクノロジー「AI警告危険人物」

note

裏カツ164日目！アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

note

ぽんず｜管理職のAI仕事術

note

AIに丸投げしたら「自分の言葉」が消えた40代管理職の話

note

#2 : プロンプト研究講座【第18回】複数キャラクターの関係性の描き方

note

BANGLASOCIALBENCH: バングラデシュの社会的交流におけるLLMsの社会語用論および文化的適合性を評価するベンチマーク

要点

関連記事

テクノロジー「AI警告危険人物」

裏カツ164日目！アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

ぽんず｜管理職のAI仕事術

AIに丸投げしたら「自分の言葉」が消えた40代管理職の話

#2 : プロンプト研究講座【第18回】複数キャラクターの関係性の描き方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer