| |
中国人工智能学会副理事长王国胤:大数据智能计算 |
|
[ 通信界 / 田轶 / www.cntxj.net / 2018/5/13 12:26:39 ] |
|
|
|
| |
2018中国IT市场年会——人工智能高峰论坛”在北京香格里拉酒店隆重举行。中国人工智能学会副理事长、重庆邮电大学研究生院院长、大数据智能研究院院长、长江学者特聘教授、万人计划领军人才王国胤在大会上发表了主题演讲。
以下为演讲实录: 谢谢主持人,也谢谢组委会给我这么一个机会跟大家分享一下大数据智能计算方面我的一些思考,刚才赵处长从国家这个层面给大家讲了很多产业政策方面的内容。因为我是学术界的,今天也是诚惶诚恐,我想今天我就用一点点时间从一个学术界的这么一个专家的身份,给大家报告一下我们对这个大数据智能计算以及未来智能社会到底是一个什么样的,我们怎么样看待,给大家做一个分享。 我从这几个方面来讲,一个就是说什么是大数据智能计算,为什么做,另外一个怎么理解未来得智能时代智能社会,我们智能社会要创新,那信息时代我们这个创新是跟着在走,智能时代我们有没有可能引领创新,或者说我们在做一些什么样的有没有可能大家一起来做。另外就是我再给大家报告一下我正在做的计算方面的内容,这个可能和我们大数据智能处理方面有很多的关联。 首先是这个,我想我们要回顾一下,为什么我们现在要来谈建设智能社会,实际上几十年,我们的信息社会建设解决了哪些问题,我个人感觉信息社会建设主要解决了四个方面的问题,一个就是我们数据采集,无论哪个数据,个人的数据,社会的数据,整个世界的数据,我们能够采集到的,这是10年20年前拿不到的。数据的存储能力现在是超大的,随便一个存储器,以前都是超级存储器了。我们的信息传输,无论是有线还是无线,现在可以说是不受限。另外我们这个计算能力也是超强,现在随便一个手机已经是我们以前的超级计算及所达不到的水平。由于这个数据的采集、存储、传输和计算能力的飞跃,使我们现在是信息社会的这样一个,我觉得是高级发展阶段,由此才可能导致我们未来要进入这样一个智能的时代,所以没有这一个信息社会的建设是不可能出现未来得一个智能的,所以大家不要想智能好像是一个突然来的什么东西,我觉得这是从信息到智能的发展。 大家经常在问,在数据这样一个网络时代里面,你看到了什么,经常看到是数据与信息爆炸处理不了,实际上我们还需要看到这五年有什么可用的能够利用的。未来我们研究应该是对世界的数据感知,一直到信息知识和决策行动对整个自然界社会的一个控制管理的这么一个互动,所以这是一个闭环的工作,在这里面我们就需要来做这个数据的智能计算处理。按照现在我们这个数据空间,实际上现在数据空间也不是以前我们所认为的数据空间,就是对我们现实的物理社会空间的这么一个映射,它是一个独立的,现在不独立了,而且这里面数据之间他是可以相互作用,包括就像我们现在的一个网络的舆情大家可以理解,就是说信息之间是可以相互作用的。 另外我们网络空间里面的这个信息和现实社会是可以相互作用的,所以我们的社会生产生活管理各个方面要发生变化,为什么这么说呢?比如说我给大家举个例子,我们在网络上面,现在讲新闻,新闻要讲真实性,如果是说假新闻这个新闻可以不理了,没作用,但是如果是说一个假新闻导致一个政府的垮台,还能够说由于这是假新闻所以重来吗。所以网络空间和我们现实社会是紧密联系的,而且也已经相互作用。由此才出现了我们现在大家谈到的数据空间,我们现在的这个人类应该说是生活在这样一个三元空间里面的动物了,所以也有了这样一个网民。网民和以前的人他的属性上有一些变化的,以前的人传统意义上来讲只生活在二元空间里面,现在这个网民在三元空间里面,人的行为模式也已经发生了一些变化,这时候我们的生产生活各个方面就要有一些变化。由此我们才能够理解为什么数据是新的。 当然数据用的好不好,也可能我们还真的用的还不是太好。这个智能时代的到来,实际上大家都在说它是由大数据和深度学习共同推动的,人工智能从1956年提出来,到现在有60多年。我们想一想60多年前那个时候计算机刚发明出来,那个时候计算机做不了什么我们现在可以做到很多复杂计算的,只是做一些专门的数字计算。在那个年代有这些科学家能够提出来要研究人工智能,研究智能机器,我现在压力也很大,我自己做人工智能研究的,60多年前科学家,那个时候在计算条件很差的情况下面,提出要做这样的智能机器的研究,我们现在的科学家能不能提出一个研究,我们60年之后这项研究还是影响整个人类社会前进的这么一个研究。所以现在对我们这一个创新研究应该说是有一个很大的挑战,所以我们经常在问自己。 这样一个情况下面,我们现在大家经常就是,我觉得社会上有很多,包括人工智能这几年很热,有很多人他突然一下就变成人工智能的专家了,这个也是就跟风式的这种研究,包括我们做产业里面,也是就是现在这个人工智能一些产业,我觉得像最近就是刚才赵处长提到十九大报告,以及我们国家政府工作报告里面提到的,人工智能这里面他是要和我们实体经济深度融合的,在现在实体经济之上的一种人工智能,不一定是我们完整脱离现在新的产业,而是在我们现有产业基础上来做的。而且我们在每一个企业或者说每一个地区,你自己的特点,应该怎么样发展,所以这个是要有差别的道路的。这个人工智能发展,有持之以恒的态度,我们最近就是人工智能他的应用由于在自然语言,听觉视觉方面应用的突破,就是从以前玩一玩,到现在做一做用一用,导致社会的变革,特别是人工智能,现在对社会产生很大的影响。 实际上阿尔法狗这个确实是引发了我们对于人工智能的思考,而且确实也引起了大家的一些恐慌,或者说一些社会负面的反应。当然我觉得阿尔法狗确实是一个很伟大的,我们以前也是在讲,你只要是在封闭环境下面,特定的一个任务,无论什么任务,最终都是机器战胜的,只是哪一天战胜的问题。所以在这样一个问题上面,他也有很多的发展的进程,所以实际上我们这个阿尔法狗以前说它是用大量的下铺来学习,后来不用棋谱来学习,以及这样一个系统,我可以下多种棋,这里面就是大家可能感觉到我们人是不是就这么恐慌,你现在可以下三种棋,以后可以下三百种棋,能不能像人类一样的,发明一个人类想玩的棋,这些技术一定是在一个封闭的特定环境下面,特定场景下面解决特定任务。无论你这个任务有多么复杂,最终我们可以有一个系统来解决,这是可以做到的,创造性的还是做不到的,因为实际上如果大家有兴趣的话,我们下来可以聊,就是人的这种创造性的机制,不是我们现在做科学系统的这种机制来做。 但是实际上我们经常讲我们人是很伟大的,机器人大家可能在座也有很多做各种各样的机器人,通常我们讲机器人,用一个系统来实现我们人的某部分功能,我们就说它是一个机器人。反过来又怎么样呢,用人做系统的一部分,但是这个事情也是很现实的一个问题,比如说就是像我们,因为我在重庆,经常有一个游戏打麻将,你在网上打的时候其他还有三方在网上,有的是远方的人,有的一个程序系统。但是实际上你在网上打麻将游戏的时候,对网里面另外一个人也在享受你给他提供的打麻将这样一个服务,所以你在网上打麻将水平不一定有我们这样一个程序系统打麻将水平高,这样一个系统里面人和程序关系的话,所以我是在想这种情况下面,可能我们说这是一个人机器。反应什么问题,人和机器系统融合的问题个我们现在包括新一代人工智能里面有一个很主要的方向,就是人机混合的混合智能系统,这是未来发展方向。 当然这里面我们人工智能也已经是在各个行业里面起到很多的作用,这个技术实际上我们在看从国家也是很重视的,“互联网+”这里面谈了,我们有很多的领域,创业创新这是不分男女老少,不分领域的,唯一一个技术就是人工智能,这也不是计算机技术,不是通讯技术,不是自动化技术。人工智能技术真的有这么重要的影响吗,我们看一下这个文件里面,他甚至高频次最高的还不是“互联网+”,而是智能,人工智能是很关键的。在整个各个行业领域里面最重要要做的这些东西,红色标注的都是智能东西,每个行业领域怎么做智能,是我们要思考,当然国家也有相关的相应的政策,包括智能战略型新兴产业占了很高比例。这样产业规模发展,大家一看有点像成指数型的,我们能不能赶上看我们努力了。 各个国家也都在做,我在这儿简单列出来,自己一看世界上各个方面的,欧美还有亚洲等等这些主要国家都做,我们国家应该特别重视,而且也讲到了这里面习总书记谈到,这是要和实体经济深度融合,不是说人工智能我们现在经常讲,发展人工智能产业要另起炉灶,不是这样的。而且就是李克强总理的政府工作报告里面也是发展智能产业,拓展智能生活,实际上是和我们现在的产业和生活是密切相关。当然这个由于今天时间有限,就不详细讲了,这里面有详细内容,大家可以去看,人工智能发展规划里面相应的东西。 我主要讲的是什么事情呢,我们讲未来,它是一个智能时代,为什么这么讲?其实我们从整个人类的历史发展情况来看,从农业时代到工业时代,主要影响的技术是什么呢,蒸汽机、电力、内燃机,在那个年代,无论哪个领域都是要去用到,而且都是有极大的推动作用。我们从工业时代到这样一个信息时代,靠的是计算机、信息网络,我们这几十年的信息化的建设,哪一个领域现在他不去做信息化呢,这样一个技术影响力有这么广,现在人工智能技术他实际上也是在各个行业领域里面去影响,所以我们一直在讲现在应该是从信息时代到智能时代,而且现在这个信息技术高度发展,我前面讲的,由于我们对数据的这几个能力的提升,导致我们现在有了这样一个大数据,在这样一个大数据资源的情况下面,有技术的这个突破,我们就可以影响各个行业领域,而且这些行业领域他还不是独立的,行业领域之间还是可以交叉融合的,甚至整个这个产业链相互上下游之间是可以影响的,所以为什么我们现在在做一些包括我们这个工业系统的一些智能化的国家一些规划里面,已经是注意到不仅仅是单一行业,而且是整个产业链的这个技术突破。 另外一个就是最近大家也在讲搞信息的人,搞智能的人,云计算,玩大数据搞“互联网+”的,这个词老在变,实际上这正是反映了我们整个这个信息技术从小数据到大数据发展的李琛,而且速度变化还在加快,我在这儿给大家简单回顾,在几百年前我们就已经有了做这样一个数据分析的理论,比如说Bayes理论,还是主要数据之一,几百年之后理论还是主流理论,这是很有创新的,我们以后能不能经的起考验。实际上我们这个研究到最近几十年,有了计算机之后,也是有一系列的不同的这些研究,所以实际上在这条道路上面,长期的一个探索,而且我们整个研究的路线,从小数据的分析到数据挖掘,海量数据挖掘,到现在的大数据挖掘,一直在探索我们怎么样来利用分析数据里面所隐含的对我们能够有用的信息和知识,解决我们的问题。当然现在这个数据由于它的分布,它的数据体量,它的维度超高,以及这里面数据的不确定,这里面数据不确定修改各种各样的不确定,甚至对于同样的数据,我们人本身的认知也是不一样的,经常比如说打个比方,我们在医院里面,为什么对于危重病人我们要进行会诊,会诊的意思就是说我们的专家对于这个病的认识是不一致的,如果大家都一致用不到会诊,所以对这些数据,同样我们有这些问题。所以这是摆我们面前需要处理的科学问题。 另外我在这儿要给大家讲一个问题,我们对于大数据现在我们通常的大家做,搞一个系统来给他进行计算处理,这是我们现在搞信息化的讨论。但是我们人怎么来做呢,还有一条路,我们人来理解这些数据,这就是我们人的认知。实际上我们用这些计算机系统处理这些数据最终的目的是干什么,是要完成我们人认知我们人,认识这样一个问题,解决这样问题的目的,用计算机系统来做这样一个计算,是不是就解决了我们人对这个问题的认知,人要解决这个问题呢,这两者之间不一定的。所以我讲就是数据的计算并不等于我们人的认知,这里面就存在一个问题,这里面比如说我把这个图给大家打出来,实际上我们在座的如果是说从计算机专业,比如说学过数据库,我们实际上整个这个计算机他的这样一个核心的理论,集合了数据库离散数据,所以他导致了我们以计算机为核心的这样一个信息处理的整个系统,他对信息的处理他是紫自下到上的,从细微的数据,原数据到我们高层次的对数据的这样一个整合,以及就你所解决的这个问题,我们的一些数据的融合。所以他是从最小的,比如说你的生日哪一天,这样一个小数据到一个复杂数据概念的变幻过程,所以是这种变幻。我们所有的现在只要是用计算机处理这些信息系统,他一定信息的这个流程是按照这样做的。 我们人呢,比如说我们大家看这个图,大家看这个图有什么感受,我们现场来做个实验,这里面我们有大的H,也有大的S,也有中间这个小的H,还有中间这个小的S,大家看了之后,你第一眼首先认出来这个大H和大S请举手,你反正看到了,你就举手,不少,你第一眼看到这个小的H和小的S的举手,少多了。通常的结论是什么,这是陈院士他们做的结论,人类认知具有大范围优先,先看到大,再看到中间的细节。这里面可以想像,你的一个老朋友,老远的走过来,你实际还没看清楚已经认出来他了,越近看的越清楚。所以实际上这样一个规律,这是基本上普遍存在的,我们人的认知是从大范围到小范围的这样一个由粗到细的过程。我刚才这么一讲,我们计算机数据处理从细的到粗的,人是从粗到细的,这两个好像是矛盾的,怎么做,所以我们现在我的研究主要干这个,所以我们在希望能够挑战未来能不能够解决这个问题,我们提一个新的计算模型,以后能不能有这种创新的模型。所以我们现在经常在讲,我们比如说用一个什么先进技术解决什么问题,这还是跟风式的,所以我们希望做这样一个工作,我们在这儿讲的这样一个大数据智能计算。我就不详细讲里面内容了,时间有限,有兴趣可以下来再谈。 多粒度大数据智能计算有多复杂呢,也不复杂,比如说你就看这一个,比如说我们一个生产车间,整个这个组织,也是从零件、仪器、设备、生产线到整个车间整个工厂也是一个自然的粒度的处理,我们整个社会他的管理也是分层分粒度的管理,我们看一个自然界,可以看到森林,可以看到树,可以看到枝叶,看到小的树叶,也是分层分级的。这种自然的,我们人的自然认知过程,能不能用一个数学模型来做,就是我们讲的粒度问题。用这样方法搞各种各样的模型,只是给大家过一下,有一个印象就可以了。有各种各样的理论,国内提出来的,国外提的,国内提的有相应的,我们把这些物品分类,分成一类两类三类,也可以分成这样三类,可以不同的分类,这就是也是反映了这种不同粒度。而且我们在云模型,把人的这样一个认知行为和计算机的一个数据处理行为,两个把它连接起来,做人和机器共同协同的这样一个计算模型等等,这些我就快速的过掉。我们提出来的就是要做这样一个粒认知计算模型,这里面就有一系列科学问题,大家如果有兴趣可以跟我下来再谈。 这样这些问题是不是只是做这么一个理论模型,我们现在也在做各种行业里面,我们自然的把这样一个模型概念用进去,在我们流程工业,我们的基础工业,材料工业,炼钢厂也是一样,这些企业里面我们把他的管理,把他做成一个多粒度的模型,我们来做他的这个多粒度的智能决策,在生态环境里面,比如说三峡的这样一个生态环境,实际上就是有几百个点,有很多的这个支流,也有不同的各个政府管理部门,不同层级的管理部门,实际上把他这个信息也是从卫星的航空的,陆地、水上、水下各个方面的信息,多元异构分布的弄在一起。如何构建一个多粒度的模型,对它进行预测。这里面也做了一些结果,效果也还是不错的,这是我们做的湖泊的,三峡是一个流动的,他就是一个流域,就是一个湖泊,我们也在做。另外包括这些聚类,聚类就是我们人的认知。 包括我们现在大家谈到的深度学习,因为深度学习现在也是推动我们人工智能发展很重要的,深度学习最近这十年起到了很好的结果,有关研究搞了几十年了,最近20年有哪些结果呢,比如说这是我们王菲月教授,20几年前在美国做的,他做的矿山控制的这么一个九层,也是一个深度神经网络。台湾的教授在伯克利做的,也是29年前做的深度神经网络,这是我自己做的,我当时还是在读博士时候,20几年前,做了五层的神经网络。那个时候做五层神经网络也是当时能够做到的最高的,这些东西当时能够做,但是我现在也在想,如果20几年前我把这个东西做成一个现实的东西,那个时候数据资源计算平台各个方面达不到,那个时候只能做做玩,把博士学位拿到就可以了,我们把这样一些思想可以用到我们这个系统里面来做。 所以我们现在也在尝试各个方面,以大数据的智能分析来解决我们各个行业领域里面的这些问题,我们这个团队也在做脑大数据、流程工业、电信、虚拟现实、生态环境的、医疗健康的,还有政务方面的。我们现在也正在承担一些相应的工作,包括基础理论,基础理论一定要做,我们工业界的同志,他实际上很多基础研究也是工业界支持,我们能不能够支持,我们做60年,600年之后都还能够影响世界的科学技术研究,如果我们能够有这种研究,今后中国的强大,我相信这是靠的住的。当前我们也得做,比如说我们现在也在做,就是网络上面的,网络上面人的这种行为分析,以及就是这个身份的管理,因为每个人在网上有各种各样的帐号,他的这个一致性身份认证问题,以及包括我们现在这个反腐很严峻的,而且是国家重阵,用大数据分析人的行为,看这里面有没有一些就是职务犯罪的评估。另外生态环境,美好生活我们要美好的生态环境。健康医疗,甚至我们国家正在推的分级医疗体系,这个分级医疗体系和我们现在讲的这样一个多粒度的计算模型,从概念上来讲,就是很吻合的,我们现在也正在做这方面工作,包括智能机器人,视觉听觉,工业系统里面智能制造里面,我们现在主要在流程工业里面,流程工业里面怎么样在他现在这样一个信息化基础之上做到他的智能决策、智能管理这方面工作。如果大家有兴趣我们下来可以进一步的探讨。我就不再山迥大家更多时间,谢谢。 |
|
|
| |
|
|
|
|
|
|
| 版权与免责声明: ① 凡本网注明“合作媒体:通信界”的所有作品,版权均属于通信界,未经本网授权不得转载、摘编或利用其它方式使用。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:通信界”。违反上述声明者,本网将追究其相关法律责任。
② 凡本网注明“合作媒体:XXX(非通信界)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
③ 如因作品内容、版权和其它问题需要同本网联系的,请在一月内进行。 |
|
|
|
|
|