CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> 国内新闻 >> 新闻正文
 
喜马拉雅自研珠峰语音生成式大模型,实现5秒内“极速克隆”声音
[ 通信界 | 静静 | www.cntxj.net | 2023/11/1 8:06:37 ]
 

通信界 10月31日消息,2023云栖大会上,喜马拉雅展示其最新的自研语音技术成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统。

据介绍,喜马拉雅珠峰语音生成式大模型,具备快速实现语音音色和风格定制的能力。这一技术支持丰富场景下的音色实时转换,为声音赋予了创造性的"变声"能力,宛如给声音涂上不同的“画皮”。此前,喜马拉雅珠峰实验室团队已通过AIGC方式创作了超过3.7万部有声书专辑,而AIGC作品的每日播放时长已超过250万小时。


在云栖大会现场,喜马拉雅展示了其自研的珠峰语音生成式大模型。该大模型由喜马拉雅珠峰智人团队与西北工业大学aslp lab展开合作,基于自研框架,实现音频与文本在统一框架下的稠密训练,用于语音生成任务,能够实现语音风格和音色的zero shot的学习和迁移,实现风格和音色的任意组合,同时,喜马拉雅基于阿里云数据湖3.0构建的云原生大数据平台为语音大模型训练提供了海量高质量数据, 是喜马拉雅语音大模型不可或缺的“数据引擎”。

据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模型目前已经取得了显著的突破,在音色定制方面实现了5秒内的‘极速克隆’声音。通过极少量的数据,该模型能够克隆出具有90%相似度的基本音色,并在短短的10秒内快速生成定制音频。未来,这项技术在短视频创作、数字人配音、人机交互对话、名人IP复刻等领域有望发挥出巨大的潜在价值,有效解决商业场景中的沟通需求痛点。”

喜马拉雅珠峰实验室资深产品专家吕睿韬现场介绍到:该语音大模型采用基于语音向量和语义标记的新型语音编解码器,其中语音向量包含用于高保真语音重建的声学细节,而语义标记(LLM)则侧重于语言建模的语音的语言内容,最终实现高效生成最富有语言表现力和最高保真度的语音(对话)内容。应用场景上,该语音大模型可应用于语音内容生成、口语对话、语音音色实时转换、说话风格迁移、语音到语音跨语种翻译、说话人匿名化等各种任务。

喜马拉雅还将展示其第二代智能语音交互系统,这一系统以阿里云的“通义千问”大模型为基础,以喜马拉雅儿童形象代言人“波波”为中心,增强了他的自然连贯对话能力,凸显了“波波”这一IP形象的特征。该智能语音交互系统已通过喜马拉雅儿童APP和喜马拉雅提供服务,波波球为家庭亲子用户提供陪伴对话功能。

 

1作者:静静 来源:网易科技 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 喜马拉雅自研珠峰语音生成式大模型,实现5秒内“极速克隆”声音
普通新闻 微软发布Windows 11重大更新 人工智能助手Copilot来了
普通新闻 丰田称纯电动车不适合澳洲,特斯拉等回击:落后者不认错
普通新闻 越南打算建首个芯片制造厂,美业界警告“成本过高”
普通新闻 联想三季度全球PC出货量1600万台 全球市场占有率23.5%
普通新闻 6400万OIS光学防抖+5000mAh大电池 vivo Y100首销1399元起
普通新闻 中信科智联精彩亮相 SAECCE 2023,C-V2X科技助力汽车产业高质量发展
普通新闻 联想集团与钛方科技等三家创新中小企业战略签约
普通新闻 元宇宙遇冷:AR向左 VR向右
普通新闻 华为前三季度销售收入4566亿元同比增2.4%,净利润率16.0%
普通新闻 中国广电已建700MHz基站59万站 5G用户突破1800万
普通新闻 天翼交通发布“城市级车路云一体化基础设施解决方案”
普通新闻 传谷歌同意向OpenAI竞争对手Anthropic至多投资20亿美元
普通新闻 小米新十年战略升级“人车家全生态”小米澎湃OS、小米14系列等首发
普通新闻 HNS2023|华为智能云广域网络,加速激活企业发展新动能
普通新闻 杨元庆:打造“从口袋到云端”能力和全景式人工智能
普通新闻 重磅!国家数据局今日正式挂牌
普通新闻 星火共燃 数智未来,星火运营商大模型重磅发布
普通新闻 金睛云华火眼金睛博士:我用 AI 刺穿黑客的大脑
普通新闻 2055084分!天玑9300性能跑分再创旗舰新高
通信视界
邬贺铨:移动通信开启5G-A新周期,云网融合/算
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
普通对话 闻库:算网融合正值挑战与机遇并存的关键阶
普通对话 工信部副部长张云明:我国算力总规模已居世
普通对话 邬贺铨:我国互联网平台企业发展的新一轮机
普通对话 张志成:继续加强海外知识产权保护工作 为助
普通对话 吴春波:华为如何突破美国6次打压的逆境?
通信前瞻
亨通光电实践数字化工厂,“5G+光纤”助力新一
普通对话 亨通光电实践数字化工厂,“5G+光纤”助力新
普通对话 中科院钱德沛:计算与网络基础设施的全面部
普通对话 工信部赵志国:我国算力总规模居全球第二 保
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 我国北方海区运用北斗三号短报文通信服务开
普通对话 华为云Stack智能进化,三大举措赋能政企深度
普通对话 孟晚舟:“三大聚力”迎接数字化、智能化、
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像