所有分类
  • 所有分类
  • 未分类

火山语音团队多篇论文入选Interspeech 2023,研究解决多类实践问题

?最新资讯?
火山语音团队最近在Interspeech 2023会议上入选了多篇论文,这些论文涵盖了短视频语音识别、跨语言音色与风格以及口语流利度评估等多个应用方向的创新突破。其中,他们提出了一种基于即时随机语句串联(RUC)的数据增强方法,用于改进短视频语音识别任务中训练和测试语句长度不匹配的问题。通过实验证明,这种方法可以显著提高长语句的识别准确率,同时对短语句的性能没有明显影响。此外,他们还提出了一种基于语音和韵律的自监督学习方法,用于口语流利度打分。通过对模型的输入序列特征进行掩码和重构,使模型具备更强大的语音和韵律表征能力,从而提高流利度打分的准确性。最后,他们还研究了非母语语音在自动发音评估中的贡献,并设计了不同的数据组合和训练声学模型的方法,以实现对非母语发音的客观评估。这些研究成果对于解决多类实践问题具有重要意义。
来源:https://www.qbitai.com

原文链接:https://aixinjiyuan.com/488.html,转载请注明出处~~~
0
广告位招租

评论0

请先
暂时无公告
显示验证码
没有账号?注册  忘记密码?