2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ 备案号:
本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。
邮箱:toplearningteam#gmail.com (请将#换成@)
如今,语音识别是智能手机包的标准部分,相应的一部分是在等待Siri、Alexa或Google返回查询时的延迟,要么正确解释,要么严重损坏。谷歌最新的语音识别功能完全离线,完全消除了这种延迟——当然,纠缠仍然是一种选择。
延迟的发生是因为你的声音,或者从它导出的一些数据,必须从你的手机到任何操作服务的人的服务器,在那里它被分析并在很短的时间后发送回来。这可以从一小撮毫秒到多个整秒的任何地方(真是个噩梦!),或者更长的时间,如果你的数据包在乙醚中丢失了。
为什么不只是在设备上进行语音识别呢?没有什么比这些公司更想要的了,但是将语音转换成毫秒级的文本需要相当大的计算能力。这不仅仅是听到声音和写一个词-理解一个人一字一句地说什么-涉及到关于语言和意图的大量上下文。
你的手机可以做到,当然,但它不会比发送到云的速度快得多,它会耗尽你的电池。但这一领域的稳步发展使得这样做似乎有道理,谷歌的最新产品让任何拥有Pixel的人都可以使用。
谷歌在这个话题上的工作,在这里的一篇论文中记录了下来,它建立在以前的进步的基础上,创建了一个小而高效的模型,足以适应一部手机(如果你好奇的话,它是80兆),但能够听到和转录你说的话。不需要等到你完成了一个句子才去思考你的意思是“他们的”还是“那里的”-它在飞快地发现了这一点。
那有什么可抓的?嗯,它只在谷歌的键盘应用Gboard中工作,它只在像素上工作,而且它只在美式英语中工作。所以在某种程度上,这只是对真实事物的一种压力测试。
“鉴于这个行业的趋势,随着专业硬件和算法改进的融合,我们希望这里介绍的技术很快能够以更多的语言和跨更广泛的应用领域采用,”谷歌写道,仿佛这是需要做好本地化努力的趋势。
使语音识别更具响应性,并使其离线工作,是一个很好的发展。但考虑到谷歌的其他产品几乎没有离线工作,这有点好笑。当您脱机时,您是否要口述到共享文档中?写封邮件?求升与杯之间的换算??你需要一个连接!当然,这也会更好的缓慢和斑点的联系,但你必须承认这是有点讽刺。
2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ 备案号:
本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。
邮箱:toplearningteam#gmail.com (请将#换成@)