日均100亿次是什么概念?百度大脑语音取得突破性进展
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
原标题:日均100亿次是什么概念?百度大脑语音取得突破性进展
人们容易高估新技术短期的爆发力,却低估其长期的影响力,比如语音交互。2012年,伴随着iPhone 4S的发布,苹果将语音助理服务Siri推向世人,一时之间,出现了许多类似“中国版Siri”的创业公司,然而几年后,语音交互依然只是一个配角,一些人开始认为,语音可能只是小众交互方式,特别是在罗永浩推出“坚果TNT”这样的奇葩语音交互产品后。
到了2019年,语音是不是未来的主流交互方式,似乎已经没有争议。百度最近公布的一组数据足以说明语音交互的普及。11月28日在百度大脑语音能力引擎论坛上,百度宣布百度大脑语音能力日均调用量已超过100亿次,应用规模处于业界第一,百度大脑面向各行各业开发者提供覆盖云、端、芯的全栈全场景语音开放能力,这一数据基本体现出各行各业智能语音调用的热度。
日均百亿次,语音迎来新奇点
日均100亿次是什么概念?截止到今年11月14日,小米小爱同学累积被语音唤醒341亿次,百度大脑语音每日被调用的次数,跟小米小爱同学多年来积累的唤醒次数,在一个量级。当然,小米小爱同学以及百度小度、天猫精灵诸多智能音箱的强劲增长,也是语音交互爆发的侧影。
只不过,智能音箱只是语音应用的冰山一角,语音搜索、语音助理、智能翻译机、声纹识别、虚拟偶像和智能硬件等C端软硬件产品,互联网教育、呼叫中心、智能客服等行业应用,都在大规模应用语音能力,语音成为跟触摸一样普及的交互方式,不同的是语音交互依赖底层AI技术,因此,才有了百度大脑这样的第三方语音能力平台的发展空间,才有了日均100亿次的语音能力调用数据。
这样的增长已经有了很长一段时间,2016年,KPCB合伙人、享有“互联网女皇”称号的玛丽·米克尔在她一年一度的互联网趋势报告中预测:
“语音已成为人机交互的新范式,在过去75年里,每10年就有一次人机交互的重大革新,人类对机器的操作,从物理手柄按键,到物理键盘鼠标,再到触摸屏,而现在语音成了重要的交互方式。”
在其看来,语音交互相对于传统交互而言具有以下特点:输入更快速,人类每分钟可说出150个单词,打字却只能完成40个单词;使用更简单,不需要用手和眼,时间更及时,不需要任何学习;更加个性化,机器可基于上下文、环境、位置、语调等大环境更好地理解人类的需求。从技术角度来看,语音计算具有成本低、尺寸小的特点,特别适合物联网。
当时互联网女王认为,如果语音识别准确率从95%提升到99%将从量变引发质变,即“爆发点”到来。当年百度、搜狗和讯飞均宣布语音识别准确率达到97%,距离“爆发点”已很近,这几年,语音识别准确率不断提升。百度大脑语音能力引擎,采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率已达98%。同时,针对户外嘈杂环境和讲话者特性的语音识别,远场交互,可支持自然对话的全双工语音交互,诸多语音技术取得突破性进展,语音交互变得更加智能、自然和友好。
语音应用场景增加,各行各业都在用。2016年前语音只是科技公司以及少部分先知先觉企业的专属,近两年特别是2018年在AI产业化趋势下,各行各业都在应用AI技术,语音是头部AI能力,百度大脑这样的平台提供覆盖云、端、芯的全栈全场景语音开放能力,让各行各业低门槛应用语音。
百度语音开放平台2013年10月上线,最初只有语音识别以及文本转语音(TTS)功能,上线后每日使用量急速攀升,2016年11月22日百度语音开放平台上线三周年之际,每日在线语音识别调用1亿4千万。最近几年百度大脑语音引擎从基础技术向全栈技术演进,拥有语音识别、语音合成、语音硬件等技术栈,覆盖智能设备、互联网应用、呼叫中心等核心场景,可满足各行各业的语音需求,这一次引擎大会上,百度大脑语音引擎就全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。
投稿邮箱:jiujiukejiwang@163.com 详情访问99科技网:http://www.fun99.cn