您的位置: 首页 >互联网 >

谷歌提供类似人类的文本到语音转换系统的更新

2019-06-21 16:45:12 编辑: 来源:
导读 谷歌本周通过博客文章向感兴趣的技术爱好者提供了有关其Tacotron文字转语音系统的最新消息。在该帖子中,该团队描述了该系统如何工作并提供

谷歌本周通过博客文章向感兴趣的技术爱好者提供了有关其Tacotron文字转语音系统的最新消息。在该帖子中,该团队描述了该系统如何工作并提供了一些音频样本,该帖子的作者Ruoming Pang和Jonathan Shen声称与一组人类听众判断的专业录音相当。作者还与其他Google团队成员一起撰写了一篇论文,描述了他们的努力,并将其发布到arXiv预打印服务器上。

多年来,科学家一直致力于使计算机生成的语音更具人性化,更少机器人化。作者指出,该任务的一部分是开发文本到语音(TTS)应用程序。大多数人都听说过TTS系统的结果,例如许多公司用于现场客户呼叫的自动语音系统。在这项新的努力中,谷歌集团将其从Tacotron和WaveNet项目中学到的知识与创建Tacotron 2-a系统相结合,将科学提升到一个新的水平。在收听提供的样本时,很难判断语音是人还是TTS系统语音是很困难的。

为了达到这种新的准确度,Google的团队使用了经过优化的序列到序列模型,以便与TTS一起使用 - 它将字母排列映射到描述音频的一系列功能。结果是80维谱图。然后,该频谱图被用作第二系统的输入,该系统使用基于WaveNet的架构输出24kHz波形。两者都是使用语音示例(来自众包应用程序,如亚马逊的Mechanical Turk)训练的神经网络及其相应的成绩单。新系统能够融合音量,发音,语调和速度,从而创造出更像人类的声音。

该团队还指出,他们仍在努力改进系统,最重要的是克服复杂单词的问题并使其实时工作。他们还希望为声音添加更多​​情感,以便听众可以实际听到幸福或悲伤,或者发现不快。这样做不仅会推动科学发展,而且会使与数字助理的互动变得更加亲密。


免责声明:本文由用户上传,如有侵权请联系删除!

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。