みなさんこんにちは、
私は小規模なデータ・イニシアチブを運営しており、複数のインド言語の音声データセットを、録音を利用し、ライセンスすることについて提供者が明示的に同意したうえで、貢献者から直接収集しています。
利用ケースに応じて、独占的または非独占的な権利のいずれかでデータセットを提供できます。目的は、ASR、TTS、音声AI、または関連する研究に取り組むチームが、倫理的に調達された音声データを利用できるようにすることです。
もしここで音声モデルを扱っていて、インド言語の音声データを探している方がいれば、ぜひご連絡ください。データセットの詳細や収集プロセスについて、もっと共有することもできます。
— Divyam
DataCatalyst 創業者
datacatalyst.in
[リンク] [コメント]


