所有分类
  • 所有分类
  • 未分类

Meta发布首个通用语音翻译系统SeamlessM4T,支持100种语言翻译

?最新资讯?
据新智元报道,Meta AI和加州大学伯克利联合发布了一个名为SeamlessM4T的多语言、多模态机器翻译系统。该系统可以实现语音到语音翻译、语音到文本翻译、文本到语音翻译、文本到文本翻译和自动语音识别等多项功能,支持100种语言。为了训练这一模型,研究人员使用了100万小时的开放语音音频数据,并得到了一个自动对齐的语音翻译多模态语料库SeamlessAlign,总计40.6万小时。在实验中,SeamlessM4T在翻译质量、性能表现等方面取得了显著的提升。此外,研究人员还使用ECAPA-TDNN开源架构作为基线模型,并对音频数据进行了预处理。整体而言,这一通用语音翻译系统在多种语言的分类能力上表现出色,为语音翻译领域带来了新的突破。详情请参阅原文链接。
来源:http://weixin.sogou.com/weixin?type=1&s_from=input&query=%E6%96%B0%E6%99%BA%E5%85%83

原文链接:https://aixinjiyuan.com/446.html,转载请注明出处~~~
0
广告位招租

评论0

请先
暂时无公告
显示验证码
没有账号?注册  忘记密码?