SLURP-TN:チュニジア方言の話し言葉理解のためのリソース
arXiv cs.CL / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、タスク指向型対話システムのためにユーザ音声から意味抽出を可能にすることを目的とした、チュニジア語(チュニジア方言)の話し言葉理解データセットSLURP-TNを紹介する。
- データセットは55人の母語話者を録音して作成されており、6つのSLURPドメインにまたがる4,165の手動翻訳済み文を含み、音響オーディオは約5時間分である。
- データセットの公開に加えて、著者らはベースラインモデルを提供し、SLURP-TNを活用する自動音声認識(ASR)およびSLUシステムの両方を開発している。
- SLURP-TNとベースラインモデルはHugging Faceで公開されており、チュニジア方言におけるSLU/ASRを研究者が構築・評価するための参入障壁を下げる。
