记者了解到,支付宝五福新年斗兽版块已吸引超亿用户参与。这种用声音喊出关键词,抢额外红包的创意游戏,成为今年五福活动的一大亮点。看似简单的游戏背后,隐藏着业界最前沿的语音黑科技,可支持亿万用户同时通过语音控制玩游戏,语音识别响应速度是传统语音技术的20倍。
声控年兽游戏被很多人评价为想象力丰富、解压神奇。在解锁红包的同时,不少网友对着手机喊出“牛牛牛”“幸福健康”等祝福,收获了意想不到的喜悦。 “八年兽声控局”这个话题在微博上获得了2.1亿粉丝。但由于需要承载数亿用户,并保证不同机型配置、不同网络条件的用户都有丝般流畅的体验,这场全民赛对语音识别技术提出了极高的要求。
传统语音识别系统往往部署在云端,对移动网络条件要求较高,难以低时延支持所有用户。为了保证稳定的用户体验,声控年兽游戏采用了达摩院语音实验室最前沿的离线关键词识别技术。将语音识别系统从云端搬到移动端,最终切割到小于5M的大小。离线部署下可以让数亿用户同时低延迟玩游戏。即使在低端手机上,这项黑科技也能在50毫秒内完成语音识别过程,比传统语音技术快20倍。
近年来,阿里语音在前沿技术和应用领域不断取得突破。 2019年,阿里语音AI凭借接近真人表达能力的交互能力,被《麻省理工评论》评选为“全球十大突破性技术”之一。 2020年,阿里语音AI首次实现了可比的端端语音识别和语音合成能力。云的级别; 2020年底,IDC最新报告显示,阿里语音以32%的市场份额继续稳居云语音AI市场第一。
寻找记者、求举报、寻求帮助,可从各大应用市场下载“齐鲁一点”APP或搜索微信小程序“一点情报站”。全省600多家主流媒体记者等你在线报道信息!