CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> AI >> 新闻正文
 
又一家清华系AI团队发大招 面壁发布端侧旗舰大模型
[ 通信界 | 定西 | www.cntxj.net | 2024/2/6 8:51:05 ]
 

通信界 近日,拥有清华系研发创始团队的面壁智能开源发布了端侧旗舰大模型MiniCPM,显著特点有三,以小博大,在最接近用户体感的 MT-Bentch 上,表现优异;其次,部署多模态能力,能说会看,还具备编程能力;其三,高效且部署成本低。

网易科技获悉,面壁智能成立于2022年8月,深耕通用 AI 领域,专注大模型技术创新与应用转化。目前,公司正在构建 Al Agent 智能体协作平台以充分释放大模型高效生产力。

此次发布的端侧旗舰大模型MiniCPM就是团队在助力通往AGI道路上的重要一步,目前,众多主流手机、PC 与汽车品牌相继宣告接入大模型,端侧模型则是云端协同的关键一环。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

据介绍,Mistral-7B 是“以小博大”的标杆模型。相比而言,面壁 MiniCPM 以2B 的参数规模、1T tokens,中英文平均成绩超越 Mistral-7B,表现优异。

与此同时,在同等规模模型中,面壁 MiniCPM 取得主流榜单的大幅领先成绩,相比 Llama2-13B、甚至40B 量级的大个子,也在代码、逻辑能力等重要榜单上毫不逊色。

演示中,我们可以看到,语言能力方面,面壁 MiniCPM 可以把中英语言夹杂的句子翻译成法语。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

他还能准确地进行知识问答,譬如准确答出山东最高山是泰山,还知道它和黄山的准确海拔,并计算出差值。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

此外,可以为你言语中的情感流露配上可爱小表情,也能对人物性格进行活灵活现的演绎。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

MiniCPM 还能够写出一串「复刻自己」的代码片段。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

具体在部署方面,面壁 MiniCPM 可以支持 CPU 推理,降低模型推理成本。同时发布的量化版本,可以做到压缩75%,性能基本无损。

面壁智能 CEO 李大海以现场演示所使用手机为例,做了一道数学题。骁龙855芯片,成本约600元人民币,按照运行5年计算,每秒7.5 tokens,那么170万 tokens 的推理成本是人民币1元。低成本端侧推理之外,仅需一台电脑、一张显卡就能完成对 MiniCPM 的 SFT。

据了解,团队还对 iOS,、Android 和 Harmony 等操作系统进行了模型适配。目前,MiniCPM 已跑通了国际主流手机品牌和终端 CPU 芯片。

值得一提的是,面壁还一并开源了一个12B 多模态模型 OmniLMM,并取得 Object HalBench 榜单第一,在 MMHal-Bench 仅次于 GPT-4。

李大海表示,这是面壁“大模型+Agent ”双引擎战略的关键一步,从智能发展而言,我们坚定认为智能体化是未来迈向通用智能的必由之路,而智能体必然要在端侧服务用户,我们接下来会进一步探索 Agent +云端协同的工作机制,实现智能赋能万物。

面壁智能联合创始人、清华大学副教授刘知远认为:从技术研判而言,2023年 ChatGPT 和 GPT-4的推出,表明大模型技术路线已经基本确定。

“接下来就是要探索其科学机理,并极致地优化效率,我们这次推出端侧大模型,也是向大家分享一个2B 级别大模型所能达到的性能机制,让大家认识到即使2B 尺寸大模型的效果极限还没有被充分挖掘出来,这是一个科学问题也是一个技术问题,需要大家共同探索。”

 

1作者:定西 来源:网易科技 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 又一家清华系AI团队发大招 面壁发布端侧旗舰大模型
普通新闻 苹果解释在华收入下降:全球竞争最激烈的手机市场
普通新闻 对手败了!联发科天玑9300名正言顺旗舰性能第一
普通新闻 中国移动和华为联合打造的“移动云手机”  荣获2023年ICT优秀案例
普通新闻 郑纬民院士:大模型训练完全可以用国产超算来支撑
普通新闻 国资委重要指示:将市值管理纳入央企负责人考核
普通新闻 “能源”的风吹到了移动,离电信和联通还会远吗?
普通新闻 智算竞赛白热化,揭秘运营商的智算雄心(附最新进展)
普通新闻 最近的年轻人,开始流行当“过年主理人”
普通新闻 美图携手三星 以生成式编辑、AI图生图功能打开手机创作新空间
普通新闻 开始申报!一图读懂《鹏城实验室科教基金会-中国移动科创基金2024年
普通新闻 5G、AI等技术创新应用力度加大,数实深度融合进入发展新蓝海
普通新闻 通信界观察:FTTR进入规模发展加速期
普通新闻 游戏行业新调查:开发者非常担心AI和裁员
普通新闻 马斯克要求特斯拉给他涨薪的背后:还想要更大控制力
普通新闻 字节收紧,从“降薪”开始,高绩效员工怒了
普通新闻 苹果改变应用商店支付政策却仍收高额佣金 软件开发商:令人愤慨
普通新闻 探索运营商能源转型 | 华为发布2024站点能源十大趋势
普通新闻 腾势N7发放“年终奖”!高速NOA、预瞄正式推送,智能驾驶领先两代!
普通新闻 腾势全车系史上最大规模OTA来了!D9、N7、N8全面焕新
通信视界
邬贺铨:移动通信开启5G-A新周期,云网融合/算
普通对话 李彦宏:不断地重复开发基础大模型是对社会
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
普通对话 闻库:算网融合正值挑战与机遇并存的关键阶
普通对话 工信部副部长张云明:我国算力总规模已居世
普通对话 邬贺铨:我国互联网平台企业发展的新一轮机
普通对话 张志成:继续加强海外知识产权保护工作 为助
通信前瞻
亨通光电实践数字化工厂,“5G+光纤”助力新一
普通对话 亨通光电实践数字化工厂,“5G+光纤”助力新
普通对话 中科院钱德沛:计算与网络基础设施的全面部
普通对话 工信部赵志国:我国算力总规模居全球第二 保
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 我国北方海区运用北斗三号短报文通信服务开
普通对话 华为云Stack智能进化,三大举措赋能政企深度
普通对话 孟晚舟:“三大聚力”迎接数字化、智能化、
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像