語の境界を越えて:ヘブライ語コリファレンスのベンチマークと形態的に複雑なテキストの評価プロトコル
arXiv cs.CL / 2026/4/21
📰 ニュースModels & Research
要点
- この論文は、現代ヘブライ語向けのコリファレンス解決データセット「KibutzR」を提案し、語の境界と発話(mention)の境界が一致しにくい形態的に豊かな言語の課題に対応します。
- 発話の粒度を語・サブワード・複数語にまたがるレベルで扱い、モルフェーム/トークン境界の不一致を直接考慮するセグメンテーション対応の評価プロトコルを導入しています。
- 実験では、現在のLLMがヘブライ語で英語より大幅に低い性能を示し、さらに区切り(セグメンテーション)されていない生テキストでは性能が悪化することが分かりました。
- ヘブライ語では英語と逆の傾向として、小規模なエンコーダ型モデルが当世代のデコーダ型モデルより大きく優れることも報告されており、MRL向けのモデリングと評価の見直し余地が示されています。
- このベンチマークとプロトコルは、ヘブライ語以外の他の形態的に複雑な言語に対する今後の研究を導くことを目的としています。
関連記事

NVIDIA DGX SparkフルスタックAIハッカソンで作ったものが総合1位に—『Starfire』から『Molecules AI』へ
Dev.to

進捗を失わない:VS Codeでプロ仕様のJupyterワークフローをセットアップする(Colabのタイムアウトともおさらば!)
Dev.to

AgentOSを作る:保険請求の「AWS Lambda」を目指している理由
Dev.to

状況はここまで来た——1年で何もかも変わった:Kimi、Minimax、Qwen、Gemma、GLM
Reddit r/LocalLLaMA
Grok-2 Mini と Grok-3(mini)はどこにあるのか?
Reddit r/LocalLLaMA