MELIの紹介：北京語-英語言語インタビュー・コーパス

arXiv cs.CL / 2026/3/31

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、オープンソースの北京語-英語言語インタビュー・コーパスであるMELIを紹介する。本コーパスには、51人のバイリンガル話者による発話の29.8時間分が含まれている。
MELIは、2つの話し方のスタイル—文の音読と、言語のバリエーション、標準性、学習経験に焦点を当てた自発的なインタビュー—を特徴とする、対応付けられた北京語および英語のインタビュー・セッションを組にしている。
データセットは、音声の完全な書き起こしに加えて、単語レベルおよび電話（フォニーム）レベルのフォースアラインメント、匿名化された録音、ならびにトークン／タイプ統計やコードスイッチングのパターンといった補助メタデータを提供する。
録音された音声は44.1 kHz（16-bit、ステレオ）で取得されており、本コーパスは、話者の言語に対する態度に結び付けられた形で、言語間／同一言語内、および話者間／同一話者内の音響比較を可能にすることを目的として設計されている。
MELIは、書き起こし、アラインメント、メタデータ、ラベル付きマップスキャン、およびドキュメントを含めて、CC BY-NC 4.0ライセンスのもとで公開予定である。

要旨: 本研究では、51人のマンダリン英語バイリンガル話者からなる29.8時間の音声を収録したオープンソース・リソース「Mandarin-English Language Interview (MELI) コーパス」を導入する。MELIは、マンダリンと英語で対応づけたセッションを組み合わせ、2つの話し方スタイル――すなわち、文の読み上げと、言語のバリエーション、標準性、学習経験に関する自発的なインタビュー――を含む。音声は44.1 kHz（16-bit、ステレオ）で録音された。インタビューは完全に書き起こされ、語および音素レベルで強制アラインメントされ、匿名化された。記述的には、マンダリン成分は約14.7時間（平均所要17.3分）、英語成分は約15.1時間（平均所要17.8分）である。各言語についてトークン／タイプ統計を報告し、コードスイッチングのパターン（マンダリンのセッションで頻繁に見られる；英語のセッションではより限定的）を記録する。コーパス設計により、話者内／話者間、言語内／言語間の音響比較が可能となり、音声データを話者の自己申告する言語態度に結び付けることで、量的分析と質的分析の両方を可能にする。MELIコーパスは、書き起こし、アラインメント、メタデータ、ラベル付き地図のスキャン、ならびに文書化を含め、CC BY-NC 4.0ライセンスのもとで公開される。

Black Hat Asia

AI Business

トヨタ車体富士松工場、構内運搬車を10年越しでレベル4自動運転化

日経XTECH

単に役立つオープンソースの貢献者

Reddit r/LocalLLaMA

韓国のAIチップメーカー、推論向けに4億ドルを調達

AI Business

Ollamaはプレビュー版で、Apple Silicon上でMLXにより駆動されるようになりました

Dev.to

MELIの紹介：北京語-英語言語インタビュー・コーパス

要点

関連記事

Black Hat Asia

トヨタ車体富士松工場、構内運搬車を10年越しでレベル4自動運転化

単に役立つオープンソースの貢献者

韓国のAIチップメーカー、推論向けに4億ドルを調達

Ollamaはプレビュー版で、Apple Silicon上でMLXにより駆動されるようになりました

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer