CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> AI >> 新闻正文
 
挑战Sora 剑指音效师 Pika的AI视频不再“静音”
[ 通信界 | 丁广胜 | www.cntxj.net | 2024/3/11 7:11:05 ]
 

挑战Sora 剑指音效师 Pika的AI视频不再“静音”

1. 如何让文生视频更好用,Pika再下一城。不仅仅是文生视频,AI连音频也一并搞定,且非常逼真。Pika说不好意思他们不再“静音”了,音频生成包括两个方法,一是输入Prompt,二是直接根据视频内容匹配生成。Pika把这一功能称为“Sound Effects”。目前开放测试版给到“超级合作者和专业用户”。

挑战Sora 剑指音效师 Pika的AI视频不再“静音”

2.输入Prompt生成音频或许不值得特别惊讶,大家乐见其成的是“根据视频生成”,即你让AI生成了一段视频,Pika根据视频再帮你搞定音频,且这个音频完全符合现实世界——让我想起了电影工业的昂贵“手艺人”音效师——又一个即将失业的群体?

3.“这是工程上的一个小进步,从技术角度来讲,没什么”。英诺天使基金合伙人王晟告诉网易科技《态度》,虽然Pika生成质量方面还有不少问题,但这是趋势,AI把各种模态都统一起来,用一个Prompt去解决,这大大提升了视频制作的流程和效率,AI让这个事情变得非常简单,但本质上技术难度不大。

4.在Pika的x博文留言区,引来了音频工作者的质问:能分享一下训练音频的数据吗?许多创作者担心他们的作品在未经他们同意的情况下被你们使用。

5.文生音频其实比文生视频要成熟。经过网易科技粗略统计,市面上公开可用的文生音频工具多达50+款,但生成质量层次不齐。比如,伦敦创业公司Stability AI在靠文生图获得大量关注之后,就曾于2023年推出Stable Audio,用prompt的方式写歌,描述音乐流派、乐器、画面、感觉就可以生成一段音乐demo。

6.多模态是大势所趋,AI将重塑创作的每一个角落。从大模型在文生图应用的大放异彩,再到文生视频Sora的惊艳众人。AI定会不断的给我们惊喜,从文本、音频、视频的全链条AI化,这是通往AGI的天然场景,也可能是证明AGI的绝佳方式。

7.Pika创始人郭文景称其对标的产品就是Sora,当Sora横空出世之时,所有人都在为Pika捏一把汗,郭文景当时的表态是:“振奋人心,筹备直接冲”。今天率先推出文生视频的音频生成功能,想必是她冲击Sora的其中一步。

8.这家公司成立于2023年4月,同年11月发布了Pika 1.0。Pika1.0的主要功能是:一是用文本和图像生成视频,只需要输入几行文本或上传图像,就可以创建简短、高质量的视频;二是编辑更改视频,输入相关文本,实现对背景环境、衣着道具等元素的增减或者更改;三是切换视频风格,例如在黑白、动画等不同风格中转化;四是更改视频的宽高比。2024年2月28日,Pika 推出新功能 Lip Sync,允许用户为视频添加语音对白,并实现嘴唇同步的效果。而后,最新的更新便是今天这次。

 

1作者:丁广胜 来源:网易科技《态度》 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 挑战Sora 剑指音效师 Pika的AI视频不再“静音”
普通新闻 全国人大代表,中国铁塔党委书记、董事长张志勇:推进行业大模型高
普通新闻 全国人大代表、中兴通讯苗伟:助力数字经济做强做优做大,实现资源
普通新闻 两会声音:关于AI,两会代表们都说了啥?
普通新闻 通信界观察:大模型产业落地,安全运营能否迎来“自动驾驶”时刻?
普通新闻 谷歌Tensor G4采用三星FOWLP封装,与三星 Exynos 2400相同工艺
普通新闻 美国限制出口!AMD中国特供AI芯片备受阻挠,MI309面临挑战
普通新闻 全国人大代表刘宏志:推动数字乡村建设、激发乡村振兴“数智力量”
普通新闻 2024年世界移动通信大会收官 从中国移动咪咕看到美好数智未来
普通新闻 “独角兽王国:英国科创探路者大奖”面向全球增长型企业开放申请
普通新闻 迈向可持续未来:WAA发布Wi-Fi行业能效白皮书
普通新闻 全国人大代表刘宏志:数字化建设加速 为乡村振兴提质增“智”
普通新闻 胜友如云!2024,亚信科技AntDB数据库主打一个“破圈”
普通新闻 我国成功发射卫星互联网高轨卫星
普通新闻 工信部:发布国内首个个人信息保护AI大模型“智御”助手
普通新闻 MWC2024|首次参展MWC的中国电信秀出了哪些“中国经验”?
普通新闻 2023年工信部共承办建议提案1888件 ,均已按期办结
普通新闻 MWC2024|工信部张云明:加大5G-A、万兆光网研发
普通新闻 MWC2024|引领“无线”“AI”新风向,高通打出“组合拳”
普通新闻 罗德与施瓦茨RedCap测试解决方案获得GTI Awards2024大奖
通信视界
高通CEO安蒙:生成式AI走向终端,将带来最大智
普通对话 高通CEO安蒙:生成式AI走向终端,将带来最大
普通对话 李彦宏:不断地重复开发基础大模型是对社会
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
普通对话 闻库:算网融合正值挑战与机遇并存的关键阶
普通对话 工信部副部长张云明:我国算力总规模已居世
普通对话 邬贺铨:我国互联网平台企业发展的新一轮机
通信前瞻
亨通光电实践数字化工厂,“5G+光纤”助力新一
普通对话 亨通光电实践数字化工厂,“5G+光纤”助力新
普通对话 中科院钱德沛:计算与网络基础设施的全面部
普通对话 工信部赵志国:我国算力总规模居全球第二 保
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 我国北方海区运用北斗三号短报文通信服务开
普通对话 华为云Stack智能进化,三大举措赋能政企深度
普通对话 孟晚舟:“三大聚力”迎接数字化、智能化、
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像