公開データセットについて、1週間ほど前に投稿したことをお伝えします。元のデータはバグのため廃止せざるを得ませんでした。その代わりに7言語の置換版が公開され、コミュニティが自由に触れることができます。フィードバックをいただければ幸いです。
https://huggingface.co/datasets/vadette/macro_prosody_sample_set
このパックは、語族的に異なる言語ファミリーと音声タイプを跨ぐように選択されました:
韓国語は語末焦点を示す特徴と複雑なモーラタイミングを持つ孤立語で、ストレス・タイムのインド・アーリア語系言語との有用な対照となります。
ヒンディー語はここで最大のコーパスであり、インド・アーリア韻律のベースラインに対して強力な統計的力を提供します。
ヘブライ語はVSO型のセム語で、語根と語形パターンの形態論を持ちます。高いメタデータのカバレッジは、人口統計的に層別化した分析に有用です。
マンクス語はケルト系復興言語で、母語話者コミュニティが非常に小さいです。98%のPRISTINEレートは、動機づけられたコミュニティ貢献者による録音条件が厳密に管理されていることを反映しています。
ツェルトル語はマヤ語族で、エルガーティブ-アブソルーティブな配列と独特の音調レジスター体系を特徴とします。音響データセットにはほとんど含まれていません。
マギンダナオ語(SPS2)はフィリピンのオーストロネシア語族の自発話です。T2重分布はSPS2コーパスの自然発生的な録音条件を反映しています。
ラシ語(SPS2)はバロチスタンで話されるシンド語の一変種です。中央値クリップ長は短く(3.4秒対CV24語の5–6秒)、自発的なスピーチ形式を反映しています。
[リンク] [コメント]
