ウクライナ語の視覚的語義曖昧性解消ベンチマーク
arXiv cs.CV / 2026/3/26
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、最小限の文脈で、画像の集合から曖昧な語の正しい意味を選択することを目的とした、視覚的語義曖昧性解消(Visual-WSD)タスクのための新しいウクライナ語ベンチマークを提案する。
- 既存のクロスランゲージベンチマークの手法(英語・イタリア語・ファルシ語で使用されていたもの)を適応し、言語間の比較を可能にする。
- データセットは半自動的に収集され、ラベリング品質を向上させるために領域の専門家による入力で改良された。
- 実験では、8つの多言語/マルチモーダルの大規模言語モデルをベンチマークで評価し、英語のVisual-WSDベンチマークで使用されているゼロショットのCLIPベースラインよりも、試験したすべてのモデルが低性能であることを見出す。
- 分析により、Visual-WSDタスクにおけるウクライナ語と英語の間に大きな性能差があることが特定され、現在のマルチモーダルモデルには言語固有の課題があることが示唆される。