Mozilla更新公共语音数据集 有18种语言的1400小时语音

导读 Mozilla希望让初创公司、研究人员和业余爱好者更容易构建支持语音的应用程序、服务和设备。为此,它今天发布了最新版本的Common Voice,

Mozilla希望让初创公司、研究人员和业余爱好者更容易构建支持语音的应用程序、服务和设备。为此,它今天发布了最新版本的Common Voice,这是一个开源的语音数据集,现在包含了来自42000个贡献者的1400多个小时的语音样本,涵盖18种语言,包括英语、法语、德语、荷兰语、哈卡钦语、世界语、波斯语、巴斯克语、西班牙语、汉语、威尔士语和卡巴语。

Mozilla声称它是同一个语言中最大的多语言数据集之一,比八个月前发布的通用语音语料库大得多。它包含了20000名英语志愿者的500小时和400000条录音,语料库很快就会扩展。据该组织称,目前正在通过通用语音网站和移动应用程序积极收集70种语言的数据。

通用语音可以集成到Deepspeech中,deep speech是一个开源的语音到文本和文本到语音引擎,是由Mozilla的机器学习小组维护的训练模型。它不仅包含语音片段,还包含志愿者提供的元数据,可用于训练语音引擎,例如说话者的年龄和性别。

为了简化这个过程,Mozilla本周推出了一个改进的Common Voice网络工具,可以根据不同的提示进行编辑,还提供了查看、重新录制和跳过剪辑的新控件。此外,它引入了一个新的配置文件功能,允许用户跨语言跟踪进度和指标,并添加人口统计信息。Mozilla表示,在接下来的几个月里,它将尝试不同的方法,通过社区努力和新的合作伙伴关系来提高数据的数量和质量。最终目标是为那些寻求建立和使用语音技术的人提供更多更好的语音数据。

原标题:Mozilla更新后的公共语音数据集现在包括18种语言的1400小时语音。

编辑:李晓玲。

本文就为大家讲解到这里。

免责声明:本文由用户上传,如有侵权请联系删除!