CNSL-bench:中国語の全国手話におけるMLLMの手話理解能力をベンチマークする
arXiv cs.AI / 2026/4/27
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文では、MLLM(マルチモーダル大規模言語モデル)の中国語の全国手話(CNSL)理解を評価するための、包括的なベンチマーク「CNSL-bench」を提案する。
- CNSL-benchは、地域ごとの異形や非標準的なバリエーションによる曖昧さを抑えるため、公式の「National Common Sign Language Dictionary」に基づいて設計されている。
- テキスト説明・画像・手話動画の複数モダリティを整合させて提供し、空中書き、指文字、(中国語の)マニュアルアルファベットなど、発話(手指動作)の多様性も扱う。
- 21の最新のオープンソースおよびプロプライエタリなMLLMを用いて評価した結果、人間の性能に比べて依然として大きく劣っており、その差は入力モダリティや手指動作の種類によって体系的に異なることが分かった。
- 分析により、推論能力の改善だけでは解消されない制約が残っており、さらにモデルごとに指示追従の頑健性が大きく異なることが示唆される。




