【编者按】5月初,“2017中国工业大数据大会·钱塘峰会”在杭州国际博览中心举办。本届峰会以“数据驱动创新 融合引领变革”为主题,围绕工业大数据展开分享与交流。中国科学院院士、西安交通大学数学与统计学院徐宗本教授以“大数据与智能制造融合应用”为题发表演讲,引起了媒体的广泛关注。现摘登其部分观点,以飨读者。
作为一个数据科学家,今天我讲两个观点:第一,政府和企业只要扎扎实实打好基础,就能从大数据技术上获益。第二,大数据技术目前是一个正在从应用中逐渐走向成熟的技术,挑战仍然很多。
大数据是很多工作的基本“标配”
什么是大数据?什么是数据?什么是资料?资料就是生产过程、管理过程,乃至经济、社会、生活过程的记忆,那些记忆可能表现在一个文件、一段演讲、一段文字等等。资料放在计算机上就叫数据,所以有个标准的说法,数据是指以编码形式存在的信息载体才是数据。真正的大数据是指大而复杂的资料集,这些复杂性包括了海量性、时变性、异构性、分布性等等,是我们从互联网的数据能够观察到的特征。只要数据量超过临界量,就叫大数据,反之则不叫大数据。因而讲大数据涉及两个概念:第一,大和小是相对概念;第二,相对的特定问题而言,不同的决策问题要求的数据不一样。
大家认为现在是大数据时代,大数据可以解释任何事情,其实是不正确的。当然,不重视大数据同样不正确。现在都说大数据是基本的生产资料,大数据是基本的生产力,因而才说大数据是经济社会的基本生产资源。大数据离不开互联网,近几年互联网的发展走向是从复杂的信息传递到消费互联,再到生产互联,也就是物联网,再到智慧互联。在这个走向中信息技术向互联网产生以后,要与其他任何领域深度整合,这就是今天谈论信息工业化、谈论大数据的主要原因。
目前有太多的新技术,比如说物联网、人工智能、移动互联网等等,其实这些新技术都是信息技术的一个层面,大家不要期望某一个技术包打天下。真正产生效益和作用的是所有技术的综合运用。千万不要以为有了大数据就不讲物联网,讲物联网就不讲互联网,讲互联网就不讲人工智能,其实大家是互补的,都是从不同的层面讲问题。
互联网和云计算是基础设施,这是肯定的。物联网讲的是交互方式,人工智能讲的是应用模式,那么大数据讲的是信息技术,是人和人、人和机器、机器和机器交互的内容特征。所以,从这个意义上讲,大数据是最底层的信息技术,任何工业要实现“两化”,任何政府要实现科学决策,大数据是基本标配。
大数据可以带来超凡价值
对于大数据如何去运用,我想说五句话。
第一,明确目标是前提。这是推出大数据产业最重要的一步。我们用大数据不是说国家发个战略,有个文件就用大数据。我认为只有真正解决每个地区、每个政府、每个企业不同的问题,大数据才有用。
第二,拥有数据是基础。大数据产业就是以现代技术设施为基础,以数据为生产要素,以数据的价值挖掘为创新活动的产业,叫大数据产业。因此,没有数据就谈不上大数据产业。
第三,计算平台是支撑。换句话说,没有一定的计算架构和计算平台,计算不了。它是支撑作用,但做企业的人不必过分强化,也不必过分低估。
第四,分析技术是核心。这是当今较少提到的一个主题。我非常担心在整个大数据的链条中,有些链条做得过分粗壮,有的链条过分纤弱,也就是产业链布局不均衡。如果过分膨胀,将会产生新的产能过剩。
第五,产生效益是根本。在这里送给大家四句话:数据是基础,平台是支撑,技术是核心,盈利是王道。只有记住这四句话,大数据产业才能既不走样也不失败。
为什么大数据可以带来超凡价值?我概括了三条原理:第一,量变到质变的原理。大数据之所以有用,是因为数据积攒到了可以质变,通过数据就可以知道背后的故事。第二,分析出价值原理。刚才已经提到,如果存储不分析,无疑是只买米不做做饭,产生不了实际效益。所以,要分析,要挖掘。第三,跨界关联原理。这三条原理是我概括出来的,和大家分享。
这个过程中有很多观念要改变:第一,数据是资产;第二,用户是资源;第三,服务即感知。正如刚才所说,大数据突飞猛进地发展,能够解决相当多的问题,但千万不要以为大数据技术已经成熟了。挑战仍然存在,主要是分析基础被破坏,计算技术待革新,真伪判定需要重建,对新技术的盲目所引起的盲从。现在大家的认识越来越清晰,萧山区政府的认识就非常正确。总体来说,虽然挑战很多,但是仍需集中力量攻克,大数据的发展才能有大的突破。
智能制造大数据:机遇与挑战
制造大数据非常重要,“中国制造2025”主要讲的就是这件事情。继互联网之后,真正能够对企业产生重大影响的就是大数据。同时,要将大数据与其他技术相结合。现在人工智能潮正在到来,在可见时间内,真正能够称得上人工智能、真正发挥作用的就是数据智能,就是大数据。因为人工智能简单是两个大的类型,一类是模拟人脑工作机制、行为方式,是仿脑类脑的技术;另一类是快速的认识,因为人脑对大数据的认识本身没有那么快,但获取数据的速度极强,可以从数据中分析出人类认识问题特定的方式方法,这就是数据智能,也叫人工智能。所以,真正起作用的主要是数据智能,而从这个意义上讲,数据智能无法和大数据分开。
大家说大数据能服务于转型升级,我建议至少要清楚什么是转型和升级。工业中的转型,就是过去以产品为中心,进行产品组织设计、制造、销售管理,到以服务和以定制化为中心。
最近有一个基本的观点,说从过去的老三基到新三基,过去的材料、工艺、零部件是老三基,现在的新三基是大数据、传感器和零部件。大家要知道,对一个行业来讲,数据的复杂性来源于设计、制造、运行和服务,来源于对每一个数据的仔细分析。离散型和连续型并存,数值型和非数值类型并存,结构化和非结构化并存。大数据必须关注完整属性,必须关注产品全寿命特性,必须关注全方位连接,关注制造系统融合等等,这些要求使得我们认为基本难点在认知知识数据。其实全链条数据,如物理模型的结合,也是这方面技术的难点。
大数据是新一代信息技术的基础性技术,需要应用,工业大数据非常有潜力,但一定要解决好定位问题、规划问题、切入点问题、标准问题、开发共享问题等等,互联互通是基础,定制化服务是中心,懂数据会分析是关键。