您现在的位置: 通信界 >> 市场动态 >> 新闻正文  
 
vivo携手昆仑芯、wenet助力提升语音识别效果与性能,共建开源生态
[ 通信界 / 静姝 / www.cntxj.net / 2022/11/28 22:03:11 ]
 

语音识别是AI领域的一项重要基础服务,同样也是vivo AI体系中举足轻重的能力,是Jovi输入法、Jovi语音助手等应用的基石。打造高准确率、高性能的语音识别引擎,才能给vivo亿级的语音用户带来良好的体验。基于wenet端到端语音识别工具,vivo结合自身业务场景进行深度优化,成功研发离线和流式识别引擎,支撑vivo语音业务的快速发展。



随着用户量的快速增⻓,语音识别性能问题凸显,CPU推理方案在峰值场景TP99延时较高,且难以满足高算力的业务场景。为确保良好的用户体验、进一步提升产品及服务质量,性能优化、降本增效势在必行。


vivo AI工程中心在模型推理加速积累了多年经验,为此自研一套语音识别流式推理引擎。引擎支持动态batching、显存池、数据分桶排序等特性,同时支持CPU和GPU,并在GPU上取得了不错的加速效果。


昆仑芯科技深耕AI加速领域十余年,专注打造拥有强大通用性、易用性和高性能的通用人工智能芯片,并持续精进在芯片架构、软件栈、工程化系统层级等方面的技术实力。目前,昆仑芯科技已实现两代通用AI芯片产品的量产及落地应用,通过用算力赋能不同场景中的 AI 应用,驱动千行百业的智能化转型。


为进一步降本增效以及提升用户体验,vivo AI工程中心同步启动AI多元算力项目,联合昆仑芯科技,在语音识别场景首先展开研发共建,深入合作,并已取得阶段性突破进展。


vivo自研语音识别流式推理引擎


整个引擎包括四部分:


1.wenet解码器,包括前端处理(特征、VAD等)->encoder->语言模型(wfst)->decoder流程;


2.数据调度,动态batching、分桶排序等;


3..Runtime适配层,抽象模型推理接口,便于适配不同推理后端;


4.Runtime层,后端推理层包括onnxruntime、GPU、昆仑芯的XpuRT等。



自研引擎特点:


支持多batch流式请求,多batch能充分发挥硬件计算性能;


动态batchting,根据实际请求会在一定时间自动组装batch,便于提升引擎的并发吞吐能力;


分桶排序,减少多batch的无效padding,减少无效计算量;


显存池,高并发下流式识别缓存会频繁申请和释放,通过显存池优化了这部分开销,提高性能。


另外针对语言模型(wfst)优化:


语言模型的lattice-faster-decoder过程有千万/秒的小对象内存申请(ForwardLink和BackpointerToken),通过将小对象合并大对象的池化方案,一次wfst的search从14ms减少到5ms;


线程模型优化。默认的线程模型是一个会话一个pthread线程,在GPU方案中,每秒数千线程创建系统负载较大,通过将pthread线程优化为bthread;


对象复用。将AsrDecoder池化复用,减少内存的动态申请,cpu性能提升27%。


昆仑芯高性能推理库方案


AI推理引擎面临的最大技术挑战——同时满足业务快速灵活迭代和硬件高性能。面对该挑战,昆仑芯科技团队为vivo提供了两种解决方案:基于图编译引擎方案和基于高性能推理库方案。综合业务和性能的双重考量,vivo团队最终选择了高性能推理库方案。该方案基于昆仑芯API高性能算子库自研模型推理大算子,主要由Encocer和Decoder两个大算子组成。


高性能推理库特点:


支持动态shape,性能与静态shape无异,相比”静态模拟动态“可节省大量宝贵的显存资源;


支持多batch流式推理,解决流式推理一大难题,特别是cache管理;


深度图优化,使用了昆仑芯丰富的图融合优化,如:ffn_kernel_fusion、attention_fusion等,可变长优化技术等;


不同量化策略,FP16/INT8动态静态量化以及混合量化;


定制算子融合,如ConforermEncoder的RelPos相关计算可以融合为rel_pos_fusion_kernel等;


自动化工具,模型一键导入等。



性能测试


对比不同后端的性能数据onnxruntime(cpu)、165w GPU、昆仑芯XPU。


硬件配置:



整体来看,在FP16量化后不同后端均达到精度无损,昆仑芯高性能推理库方案单卡并发达到了1400路,相比CPU的350路的最大并发,性能提升约4倍,首字和尾字耗时也大大降低,降本增效明显。单机单卡的测试外,也进行了单机4卡的压测,单机4卡GPU和4卡R200均达到了4000路并发。


相对主流165w GPU方案,昆仑芯语音识别高性能推理库方案通过构建大算子的方式也为业务根据自身特性做针对性融合、量化、裁剪提供了更加便捷、更加有用的工具。


昆仑芯在wenet中开源XPU支持


wenet是国内最大的语音开源社区,致力于推动语音技术落地, “共创共赢”。昆仑芯是wenet中支持的首款新型异构AI推理芯片,基于昆仑芯第二代推理卡模型推理采用语音高性能推理库的非流式解码方案,目前源码已合入到wenet主线。第二阶段,昆仑芯、vivo、wenet社区三方联手,将共同推出图引擎和高性能库两种后端推理,支持多batch流式解码,模型优化到部署端到端的解决方案,为客户业务落地持续赋能。


未来,昆仑芯将持续发挥在推理生态的领先优势,助力语音业务用户体验不断优化,同时也将与社区紧密合作,协力共建wenet国产生态。

 

作者:静姝 合作媒体:通信界 编辑:顾北

 

 

 
 热点新闻
普通新闻 同级最强!天玑8200实测成绩放出,iQOO Neo7 SE神机配神U
普通新闻 中国信通院:我国部署超 7900 张 5G 行业虚拟专网
普通新闻 省内首个智慧康养平台,点亮“银发族”数智生活
普通新闻 中国移动与中国宝武签署战略合作框架协议
普通新闻 云巨头深陷高管离职风波!三千亿美元市值已蒸发一大半
普通新闻 中国软件三十年:烟尘隐入,夹缝重生
普通新闻 马斯克世界首富之位被LVMH老板短暂超越
普通新闻 苹果将推“高级数据保护”功能 允许用户对更多iCloud备份数据进行加
普通新闻 台积电加大对美投资建厂,半导体关键技术会外流吗?
普通新闻 数字化融入生活方方面面,红帽助力客户实现多维转型
普通新闻 爱立信移动市场报告:2028年5G签约数将超过50亿
普通新闻 我国将迈入百亿物联发展征途 分三阶段实现
普通新闻 黑客帝国重现?马斯克脑机公司将开展人体试验:有点疯狂
普通新闻 OpenAI发布新作:ChatGPT聊天机器人
普通新闻 2023年人工智能发展预测 企业如何成功采用AI?
普通新闻 爱立信:5G增长快于以往任何一代移动通信
普通新闻 突破千万大关之后 被误读低估的VR
普通新闻 台积电1nm新厂计划已上报 将落地新竹
普通新闻 三大运营商股价创年内新高,新发展模型下价值如何重估?
普通新闻 解密“个人信息保护认证”
  版权与免责声明: ① 凡本网注明“合作媒体:通信界”的所有作品,版权均属于通信界,未经本网授权不得转载、摘编或利用其它方式使用。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:通信界”。违反上述声明者,本网将追究其相关法律责任。 ② 凡本网注明“合作媒体:XXX(非通信界)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 ③ 如因作品内容、版权和其它问题需要同本网联系的,请在一月内进行。
通信视界
新华三:云智原生 AD-NET构筑智能联接新底座
华为林永明:ADN 铺就高阶自智网络之路
普通对话 中国移动丁海煜:三大方向十大技术,5G-A赋
普通对话 英特尔王锐:中国战略是我们的全球战略之重
普通对话 新华三:云智原生 AD-NET构筑智能联接新底座
普通对话 华为林柏枫:联接升级,激发商业增长
普通对话 华为林永明:ADN 铺就高阶自智网络之路
普通对话 NVIDIA发力数字孪生:站在虚拟和现实之间
普通对话 韦乐平:网络深度转型最明确的方向首先就是
普通对话 中国工程院院士邬贺铨:6G标准面临小圈子风
普通对话 华为丁耘:绿色ICT,共创新价值
普通对话 爱立信中国区总裁方迎:将在中国市场重点做
普通对话 中国联通买彦州:广电5G商用对行业竞争格局
普通对话 中国联通陈忠岳:从“提速降费”向“提速提
普通对话 华为胡厚崑:5G+工业互联网 数据驱动是关键
普通对话 华为郭平:每个人磨好自己的豆腐,就会有一
普通对话 中国移动杨杰:加快推进新型平台用工模式规
通信前瞻
北斗三号卫星低能离子能谱仪载荷研制成功
中国移动李慧镝:强化数智基建驱动 推进产业转
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
普通对话 多管齐下,VMware跨云服务助力企业云转型
普通对话 中国移动李慧镝:强化数智基建驱动 推进产业
普通对话 苏少林:打造北京数字经济“五强”,助力标
普通对话 中国科大在高安全量子密钥分发网络方面取得
普通对话 华为杨超斌:迈向5.5G持续创新,开启5G产业
普通对话 中国联通买彦州:加强创新力度,协同推进6G
普通对话 信通院总工敖立:5G工业模组是产业链特别短