科大讯飞:根据目前已披露的信息,科大讯飞当下的技术利器是“深度全序列卷积神经网络”技术。该技术是针对传统思路进行突破后建立的新一代语音识别框架。同样是在去年年底,科大讯飞宣布,其语音识别成功率达到97%,离线识别率亦达95%。
百度:作为搜索服务提供商,百度在海量数据的收集上有着先天优势,这为其语音大数据库的搭建以及模型的强度化训练提供了便利。
2016年第四季度,百度宣布已将其核心识别技术应用于声学模型的构建中。据称,这使得语音的识别精度较之前提升了10%。紧接着,2016年11月22日,百度宣布百度语音在“安静条件下”的识别准确率达到 了97%。
搜狗:同百度一样,由于搜狗输入法用户基数庞大,以及搜狗搜索市场份额的快速提升,其在大数据的获取上也占尽先机。
2016年,搜狗分别在不同场合展示了 自 己的语音识别技术。从目前对外公布的信息来看,其整体技术方案是对当下几大主流建模技术的综合运用,也就是依据使用场景来选取方案的“见招拆招”的打法。在此基础上,2016年年底,搜狗对外宣布,搜狗语音的识别准确率达到 了 97%,并支持最快每分钟400字的听写。
阿里:2016年年初,阿里提出了“智能解决率”的概念,大意是旗下的智能客服产品“阿里小蜜”每天面对百万级服务量,智能解决率接近80%,远高于同类产品60%的水平。同时,在人机对话语义意图的精确识别中匹配率提升到了93%。
腾讯:2016年5月,腾讯上线智能语音服务;当年12月,发布微信语音开放平台。当时腾讯宣称,后者在垂直细分领域的识别率可达90%以上。具体到技术细节,目前尚未披露。