您的位置:主页 > 行业新闻 >
行业新闻

安振鹏:拥抱“数据+算法”定义的新世界

2018-12-03

原标题:安振鹏:拥抱“数据+算法”定义的新世界

2018年11月28日,清华大学数据研究中心举办了“2018年清华工业大数据技术论坛”。安振鹏博士就论坛中数字+算法定义的世界发表了演讲。

安振鹏认为,人类社会数千年来面临的主要挑战是如何在不确定的环境中做出决策。 2000多年前,人们面临重大决策,面对不确定性的常见方式是占卜。 500多年前,宗教是人类在不确定的环境中选择的依赖。一百年前,人类在月球上做出的每一个决定以及飞机开发的每一项重大决策都是以科学为基础的。今天,我们有了一种了解世界和做出决策的新方法:“数据+算法”。

以下是发言整理:

数据+算法定义的世界

——面对不确定性人类如何选择

亲爱的院士,专家,大家早上好!

在最高学校清华大学讨论大数据的前沿,给我经济背景下的人们带来了巨大的压力和挑战。我经常在经济专家面前谈论技术专家和技术面前的经济,所以我不会告诉你今天的具体技术,谈论技术的经济和社会影响,看看我们带来了什么样的信息和通信技术。 。

几千年来,人类如何进行决策?

几千年来,人类社会一直面临的重大挑战是,如何在不确定性的环境中进行决策,从游牧社会,农业社会,工业社会到信息社会,这是一个永恒的话题,人类在过去几千年中如何做出决定?让我们来看看过去的2000年,500年,100年以及今天人类如何在不确定的世界中做出决策,以及影响人类决策的因素。

两千年前,夏商州的领导人想要发起一场战争(好像是今年的贸易战),他们如何做出决定?《史记·龟策列传》据记载,“从古代国王将被任命为国家,推动事业,为什么不珍惜帮助好!”,是通过占卜来进行决策。面对刚刚开始的部落战争,战争的无常结果,部落领袖和王子和国王,从炮弹和占星术的裂缝中寻求帮助,预测各种重大事件的进展并指导重大决策。

小人和小人如何做出决定?《诗经》记录“艾伯,没有谣言,埃德尔,来找我贿赂。”这个小女孩要结婚了。我不知道将来我的婚姻是否幸福。然后告诉他的新郎埃尔比尔,通过占卜来判断婚姻是否是一种凶悍。如果大象没有任何问题,那么我选择了一个黄道并驾驶汽车将我和我的嫁妆带回来。

2000多年前人们面临重大决策、面对不确定性常用的方式就是占卜。

500多年前,西欧封建制度开始瓦解,宗教改革步伐继续加快。新教在西北欧占据主导地位。有专家认为,这是欧洲经济发展的重要原因。北欧比南欧好,西欧比东欧好。

马克斯韦伯在《新教伦理与资本主义精神》中指出,新教的道德和企业家精神是相互联系的。新教宣传什么理念呢?就是“拼命挣钱—拼命省钱—拼命捐钱”,与一些人认为不同,赚钱的目的是花钱。因为企业家认为世俗经济行为的成功不是为了创造可以享受和挥霍的财富,而是为了证明他们是上帝的选民。

在这种情况下,当企业家们面对各种不确定性进行决策的时候,他们的依据是什么,是新教思想影响着他们的决策,宗教是人类面在不确定性的环境中进行选择的依靠。

一百年前,爱迪生在经过数千次实验后发明了电灯。 1969年,美国人将人类送上月球。同年,他们还开发了波音747并实现了首飞。人类送往月球的每一个决定背后,飞机发展的每一个重大决定是什么?是科学。你是如何决定发射火箭的?有必要计算发射窗口周期,计算月球和地球之间的距离,并预测未来的天气变化,所有这些都基于科学的决策。如何选择飞机的形状以及如何选择材料是基于空气动力学规律,如风洞试验,其后面是科学

今天,我们有了一种理解世界和做出决策的新方法。

我们的清华大学工业大数据中心在青海有一个风电预测项目,可以准确预测未来风力发电机组(明天和后天);美国Uptake公司需要估算卡特彼勒工程机械的运行状况。实现产品的生命周期;新的零售企业箱子新鲜,它只销售当天的新鲜产品,今天不卖掉后扔掉,需要决定当天销售什么样的产品,销售量多少;我们的手机用户今天的头条新闻和淘宝的主页都是成千上万的人。这是一种新的决策方式,这种决策方式叫做“数据+算法”

“数据+算法”的决策机制,不是对已有决策机制的一种替代,是增加了一种新的决策方式。

不是因为宗教,我们不去占卜(许多现代人仍然在占卜中作出决定),占卜方法今天仍然适用。我们用科学的方法和科学技术的规律来指导人们的决策,但宗教在很多时候仍然扮演着非常重要的角色。现在我们有了一种处理不确定性的新方法,即“数据+算法”。

处理不确定性是人类永恒的挑战。关于如何理解和认识不确定性,我们有三个基本结论:首先,只有深刻理解不确定性,我们才能理解数字经济的本质;第二,对不确定性的恐惧是人类社会认知的动力;第三,不确定性源于人们在信息约束下的有限认知能力。

化解不确定性需要经过“三部曲”

在过去的千年中,每个个体,民族,部落,企业,国家等都经历过各种事件,如战争,冲突,气候灾难,狩猎,农业,企业竞争和国家间的贸易。例如,中美贸易战。

我们都面临着如何在不确定的环境中做出决策的问题。这些决定的正确性将导致成功或失败,收益和损失,利弊,对与错,好与坏,好与坏的结果。而这些结果将影响我们的个人幸福(我嫁给他,我不开心,我不知道),部落的兴衰,企业的成长,国家的繁荣,潮流历史。

因此,如何解决这些不确定性需要一个“三部曲”。首先,我们必须首先理解这个世界理解并认识到这个法律,这是我们解决不确定性的逻辑起点;第二,我们必须在理解之后预测将会发生什么,这是作出决定的基础和依据;第三,我们必须控制,这是将决策付诸行动的具体途径。所以我们刚才说过,无论是占卜,科学,宗教,哲学,科学还是本质上,都要告诉我们如何解决决策中面临的不确定性。

对不确定性认知的分野:从哲学到科学

对不确定性的认识也是从哲学到科学分化的重要因素。

我们如何认识到不确定性从哲学来看,它在古希腊初期分为两个不同的学派,在现代,形成了由笛卡尔所代表的确定性世界,世界被认为是有序的统一。 ,不可避免的,精确的,可预测的;尼采和康德相信世界是一个混乱,不同,随机,模糊的不确定世界。

从科学来看,从哥白尼的“心之头”到伽利略,再到牛顿的三个定律,现代科学成就继续加强人们对确定性逻辑规律的认识,使我们相信所有的世界都可以肯定地描述。 。然而,海森堡的“不准确”原则,哥德尔的不完备定理,阿罗的社会选择不可能性定理理论,以及二十世纪不确定性的三大发现。我们发现很多时候世界并不像牛顿定律所描述的那样可预测。

从经济学来看,对不确定性的认识始于芝加哥学派的创始人奈特,他将不确定性引入经济学,打破了以经济学研究中先前的一般均衡分析为中心的确定性环境的假设。不确定性被认为是信息经济学,行为经济学,制度经济学和演化经济学的基本理论。

最后,我们都熟悉从信息论来看,究竟是什么信息,Claude Shannon定义“信息用于减少随机不确定性,信息的价值是确定性的增加”,最重要的是减少增加的不确定性和不确定性。

什么是企业?企业的本质是什么?

我们今天讨论的是工业大数据,然后我们回到企业,什么是企业?这项业务的性质是什么?我想在不确定性的世界中进行决策是企业最本质的属性。

企业是一个组织。这个组织与市场和政府是一样的。它是一个分配资源效率的组织。政府可以分配资源,企业可以分配资源,市场可以分配资源。商业竞争的本质是什么?企业竞争的本质是资源配置效率的竞争,即利用数据的自动流动来解决复杂系统的不确定性,优化制造企业的配置效率。公司面临什么样的挑战?当我们走进工厂,车间和研发室时,我们会发现公司在想什么:如何考虑如何缩短产品的开发周期,如何增加团队的产量,如何改进机床的精度,以及如何提高一组设备的效率。所有这些问题都可归结为一个问题,即如何提高资源配置效率。

面对这些问题,企业在不完整和不确定的环境中做出各种决策,做出决策,包括:新产品开发是决策,客户定位是决策,营销策略是决策,研发组织是决策,供应链选择是决策,交付周期是决策,库存管理是决策,调度是决策,商业模式是决策,所有决策都是。

那么企业如何进行决策,对于应用工业大数据来说,怎么支撑企业决策?就是要将正确的数据,在正确的时间,以正确的方式传递给正确的人和机器。这是基于工业大数据,如何在不确定的环境中做出决策。

谈到红领的例子,青岛红领是一家个性化的定制服装企业。是国家智能制造的试点示范企业。一些企业高管在访问后非常失望,因为没有想象中的一排机器人和先进的生产线。忙碌而有序的AGV车,但是一排工人在手工加工衣服的方式,是典型的劳动密集型生产场景。

企业家很困惑,这样一个典型的劳动密集型企业为什么是智能制造的试点示范企业?有人说他与富士康没有什么不同,没有什么区别,但根本无法与富士康相媲美,富士康的自动化生产线,切片机,机器人非常先进,红领和富士康有什么不同?

我认为自动化分为两种。一种自动化是生产装备自动化,叫做看得见自动化,机器更换,立体仓库,忙碌而有序的AGV车。还有一种叫做看不见的自动化是数据融合自动流经物理世界,在正确的时间将正确的数据传递给合适的人和机器。当您收集一个人的上半身18个部分和22个指示器时,该指示器自动生成适合该体型的形状,自动生成数控机床的加工指令,并自动生成200个过程的处理过程。与大规模生产相比,定制生产远比几个数量级更复杂和不确定。

算法:将不确定性转化为确定性的最优路径

软件如何解决这个问题?我认为最基本的语言是“if ...... then ...”,这将不确定性转化为确定性。 “如果: A”“如果: B”不确定,并且“那么A1”“那么B1”变得确定,并且这种变换需要算法。将不确定性转化为确定性是否正确?这取决于数据的及时性,准确性和完整性。

从大规模生产的演变到个性化定制,不确定性逐渐增加。就像一个射击游戏,大规模生产是一个固定的目标,大规模定制相当于移动目标,个性化就像一个射击空中飞碟。有必要不断地感知它飞行的地方,转弯的地点,转弯的速度,然后分析,判断,然后决定执行。

在过去的一两百年里,产品的成本质量和效率得到了很好的解决。当进行个性化定制时,过去已经解决了成本质量和效率的问题。不确定性再次增加,如何解决?需要“数据+算法”。美国国家标准与技术研究院对智能制造有一个定义。这个定义的核心词是我想在不确定性系统中增加其确定性。

总结一下,如何能够把正确的数据在正确的时间,以正确的方式传递给正确的人和机器,需要具备两个条件:首先,隐性数据的显性化,实现数据完整性,及时性,准确性,制造过程中包含的大量隐藏数据,业务管理,客户行为,生命周期服务都在不断收集,收集和处理。第二个是隐性知识的显性化,它是工业研发技术,生产过程,业务流程,员工技能,管理概念等的逻辑化,数字化和建模,使大量隐藏的工业知识在各种软件中得到巩固。信息系统。 。

一方面,我们有及时,完整和准确的数据。另一方面,我们拥有大量隐性知识显性软件,不断将这些数据传输到这些软件,然后将数据转换为信息和信息,将知识和知识转化为决策,并做出决策以优化我们看到的物质世界。

在过程中软件是核心。那软件是什么?软件的本质是事物运作规律的编码。它构建了一套用于自动数据流的规则系统。无论是爱因斯坦的能量方程还是牛顿的三个定律,它都是我们了解这个物理世界的方式。我们对法律进行建模,对算法进行建模,对代码进行编码,对代码进行软件化,然后用软件进行优化。我们建立了三个世界,物理世界,有意识的世界和数字世界。

在过去,人类直接面对这个物质世界。今天,我们找到了代理商。谁是这个经纪人?这是网络空间。就像无人驾驶一样,我们必须在过去开车。现在你不需要开车了。您正在寻找代理商。这个人被称为无人驾驶,帮助您感知,制定决策和执行。

数字经济的本质:数据+模型=服务

两年多以前,我去了DassaultSystèmes。达索的一位科学家给了我们一个心脏结构。它通过心肌细胞告诉我们心脏中离子浓度梯度的脉冲变化。心脏某某肌肉的张力极限是多少。

我们认为这样一家软件公司与许多医院一起研究心脏的结构和机制。他们想要研究心脏运动,物理,化学和生物运动的规律。他们模拟这种运动规律并对模型进行建模。算法被编码,最后是构建数字心脏。

开发这种数字心脏的科学家是Dassault部门的高级主管Steve Levine博士,因为他的女儿Jesse在出生时被发现有一个主动脉和心室。案件。两岁时,由于心脏生理系统出现故障,Jesse安装了心脏起搏器,每年都需要进行心脏手术。在每次手术前,医生需要在史蒂夫身上签名,告诉他你的女儿在推手术室后可能会失去生命。史蒂夫每次都在受苦。他梦想有一天能开发出这样一个数字心脏。 。

这个数字心脏有什么价值?用我的话说,它是“数据+算法=服务”,建立了一个数字心脏,首先制作了心脏血管造影,血管造影是什么?收集数据,建立数字模型,并实现四种类型的功能:首先,描述,在虚拟世界中这个物理世界中发生的事情来描述,心脏的血管在哪里被阻挡,可以阻挡多少,可以360度观察。第二个是诊断,为什么它被阻塞,心血管闭塞的原因是什么;第三个是预测,如果没有人为干预,半年,一年,两年后,这个血管堵塞30%发展到70%,另一侧分支血管会阻塞,它会告诉你会发生什么;四是决策,最后做什么,是采取保守治疗,还是做旁路手术,为医生提供解决方案该方案仅供参考。

在这个过程中,数字心脏可以帮助我们提高医疗设备的研发效率,预测植入心脏的功能,进行复杂的心脏医学教学,加速科研转化为临床医学实践。

所以“数据+模型”,或者“数据+算法”构造了我们认识这一个世界新的方法。

如果我们说我们已经总结了过去人类社会的方法论来理解客观世界,那么可以有四个阶段。一个是理论推理,天才科学家通过“观察+抽象”来了解世界,例如牛顿定律,爱因斯坦的相对论;第二个是实验验证,爱迪生发明了灯泡,我们现在发明这辆车可以进行二三十次碰撞。实验中,飞机通过风洞实验验证;第三个是模拟择优,在虚拟世界中试验发现物理世界的规律,然后反馈到现实世界来引导人们的实践,高铁,飞机不必做几千小时的风隧道实验中,汽车不必做几十次碰撞实验,这些都可以在虚拟世界中完成,通过模拟数字世界来选择最佳效果;第四是大数据分析,是通过大数据发现物理世界的新规律。无论是模拟分析还是大数据分析,其背后的逻辑都是使用“数据+算法”模型。

2013年诺贝尔化学奖授予三位美国科学家Martin Kapous,Michael Reevet和Yaliya Wacherin,他们在复杂的化学系统中开发了多尺度模型。这三位科学家的贡献是构建实验方法,成为化学实验的方法论。该方法是在计算机中进行实验。它实际上是我们刚才所说的“数据+算法”的另一种表现形式。形成。

过去,您整天都在实验室进行实验,现在可以在计算机上完成一些实验。制造业也是如此。过去,从项目到交付的飞机设计和制造过程耗时超过20年。它只需要五六年,因为人们已经建立了对世界方法论的新认识和转变。高速铁路可通过虚拟高速铁路在虚拟京沪线上运行,运行速度可达200​​公里,300公里和500公里/小时,以衡量其稳定性。通过快速迭代,它构建了对世界的转变和理解。该方法是“数据+模型”的新方法。

数字化的逻辑殊途同归:数字孪生

想象一下,在接下来的十年,二十年或三十年,或者我们想到一个问题:数字化的终极版图是什么?我从未见过我们今天看到的物联网,大数据,云计算,人工智能和行业。软件和其他技术是未来数字化定稿的一部分。 ICT技术开发和应用的过程是我们继续将这个分散的模块处理成一个完整的布局过程。我们都是谜题。

那么形成的最终结果是什么?答案是数字结对,即我们继续数字化碎片化的物理世界,在CYBER空间构建一个支离破碎的数字双胞胎,然后将支离破碎的双胞胎组合成一个完整的数字双胞胎,直到构建一个数字结对的世界,从我刚才谈到的数字化诞生之心,数字双机,数字双胞胎建筑,数字双城,我们都在建设数字双胞胎世界的道路上。

我们在虚拟世界中构建数字双胞胎,并不断与物理世界进行交互和优化。这样的过程将经历三个阶段,即局部的数字的孪生阶段,静态的数字孪生阶段和动态的数字孪生阶段

因此,当需要实现动态数字蛋阶段时,可能需要20年或更长时间,现在我们只处于部分数字结对阶段,静态数字结对是在虚拟世界中构建物理世界,但数据不是实时的,需要一个循环。

我和西门子技术专家交谈过。如果我们从数字生成的三个阶段实现了实验室阶段的静态数字生成,西门子就为咖啡机制造了一条数字生产线。当天生产线的运行数据不起作用。交付到数字育种机构后进行优化,指导第二天产品的生产优化。实际实现动态数字卫生需要很长时间。所以构造一个数字孪生,其背后的逻辑就是“数据+算法=服务”,它可以缩短产品开发周期,提高建筑物的资源优化效率,并提供一种新的医学分析方法来构建城市资源配置的新模型。

最后,总结一下,数字经济的本质是“数据+算法=服务”。这些数据来自机器数据,业务数据,产品模型数据,需要不断访问物联网,传感器等。该算法部署在云中,包括两种形式。一种是机制模型,另一种是人工智能模型或大数据模型。什么是“数据+”和“+”? “+”是网络,5G,NB-IoT,TSN,以太网等。数据+算法带来了服务。这项服务包括四个层次:一个是描述世界(发生了什么?),另一个是诊断这个世界(为什么会发生),第三个是预测世界(会发生什么?),第四个是做出决定(应该做什么?),最后优化资源配置的效率。这是一种理解和改造世界的新方法。

谢谢你们。

上一篇:中国加快了电子招标的采购,很难在黑匣子里操作!
下一篇:没有了

安振鹏:拥抱“数据+算法”定义的新世界 相关的内容: