您的位置: 首页 >产经 >

微软创造了新的语音识别记录 出错率达到了5.1%

2020-01-07 14:37:46 编辑: 来源:
导读 微软表示,其语音识别技术实现了一个新的行业里程碑,将错误率降低到5 1%,在广泛认可的准确性测试中与多个人类转录器的错误率相匹配。 该公司的人工智能和研究小组今天晚上宣布的新

微软表示,其语音识别技术实现了一个新的行业里程碑,将错误率降低到5.1%,在广泛认可的准确性测试中与多个人类转录器的错误率相匹配。

该公司的人工智能和研究小组今天晚上宣布的新结果超过了微软去年公布的5.9%的前低点;以及今年早些时候IBM宣布的5.5%的错误率。

微软研究小组的语音识别工作提供了用于产品的底层技术,包括其Cortanavirtual助理、演示文稿翻译器和微软认知服务。

在最新的测试中,微软降低了其错误率,“对我们基于神经网络的声学和语言模型进行了一系列改进,”微软技术研究员黄学东在解释这一成就的帖子中说。

这是微软为推进人工智能的最新技术并将这些新方法推向市场而做出的更广泛努力的一部分。在CEO萨蒂亚·纳德拉(Satya Nadella)的领导下,微软去年组建了一个新的5000人人工智能和研究小组,作为公司内部的第四个工程部门,以及Office、Windows和云组。

微软在人工智能和云领域与亚马逊、苹果、IBM、谷歌和其他主要技术参与者竞争。雷德蒙公司的新愿景声明特别增加了对人工智能的参考,称其战略是为“智能云和注入人工智能的智能边缘构建一流的平台和生产力服务”。

下面是黄如何解释他们为达到这一最新里程碑所做的事情。

我们引入了一个额外的CNN-BLSTM(卷积神经网络结合双向长时记忆)模型来改进声学建模..此外,我们结合来自多个声学模型的预测的方法现在在帧/Senone和单词级别都这样做了。

此外,我们还通过使用Adialog会话的整个历史来预测下一步可能会发生什么,从而加强了识别器的语言模型,从而有效地允许模型适应会话的主题和局部上下文。

我们的团队也从使用可用的最可伸缩的深度学习软件Micros of tCognitiveToolkit2.1(CNT K)中获益匪浅,用于探索模型体系结构和优化我们模型的超参数..此外,微软在云计算基础设施方面的投资,特别是Azure GPU,有助于提高我们训练模型和测试新想法的有效性和速度。



免责声明:本文由用户上传,如有侵权请联系删除!

最新文章

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ   备案号:

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。

邮箱:toplearningteam#gmail.com (请将#换成@)