-
小亿 管理员
发表于2021-9-25 12:05
楼主
9月25日,由亿信华辰主办、DAMA中国协办的2021第三届数据治理峰会在上海盛大举行。筹备了4个多月的数据治理峰会获得了众多企业CIO、CDO等高管的关注,参会人员达到500余人。12场行业高端主题演讲分享,场外产品体验区火爆程度再翻倍。【大会专题】
国际数据管理协会DAMA中国主席汪广盛受邀出席,并发表《DAMA数据管理12项原则和我国的数字化转型》主题演讲。以下为演讲实录:
国际数据管理协会DAMA中国主席汪广盛受邀出席,并发表《DAMA数据管理12项原则和我国的数字化转型》主题演讲。以下为演讲实录:
大家早!首先感谢亿信华辰的各位领导以及各位同仁为我们提供那么好的机会,我们今天来了四个人代表DAMA中国,感谢有这样一个机会能够和大家分享。同时,再次感谢亿信华辰这段时间对于我们协会一直的支持,他们是我们协会首批成为理事单位的成员,首先非常感谢!其次,我代表协办方对于各位线上、线下嘉宾的到来表示热烈的欢迎!
今天我发言的题目是《DAMA数据管理12项原则和我国的数字化转型》。内容比较多,我会讲得比较快。一方面,我感觉到大家都在讲数字化转型。从去年开始,除了疫情之外,最热的话题就是数字化转型。同时,大家也可以看到许多人不知道数字化转型是什么事情,所以去年国务院国资委搞了数据要素和数字化转型百问专家团队回答许多问题,已经收集了至少超过100个问题。
我列了一些问题,什么叫数据战略?所有企业都要制定数字战略,如何开展数字化转型?我摘取了16个问题,包括国外有哪些成功案例等等,明显感觉到,我们国家顶层角度来讲,也知道数字化转型到底是什么以及怎么转,还是有许多的疑惑,所以才搞了专家百问。
我这里摘取了两个题目:
第一,数字化转型转什么?国务院国资委的专家团给了一个非常好的回答,我们要全面和整体地转。数字化转型要转什么的基础是数据,没有数据怎么搞数字化转型?这些基本的问题,我们感觉到有许多人比较疑惑。这是一个方面,大家都知道数字化转型非常重要。但是,又不知道到底怎么做,这个转型到底是干什么的。
第二,我想讲一讲我们有一套知识体系非常好,我相信对于我们国家的数字化转型会有一定的借鉴甚至指导的意义。我为什么选择这个题目?因为我今天想着重跟大家讲一讲我们的知识体系里面提出了12项原则。
这个原则到底是什么原则?对于我们的数字化转型到底有什么参考价值?我们协会1980年成立,专门搞数字管理、数字化,40年了,协会人不多,全球才2万人,总共有52个分会,我们也出了一套自己的知识体系。我刚才讲的12项原则就是在这个知识体系里面的,我们第一张就讲了12个原则。总结一下,一方面,我们都知道数字化转型非常重要,但是有许多问题。另一方面,我们有一套成熟的知识体系,也许会有一定的参考价值,所以我们来看一下。
第一,我们认为数据是有独特属性的资产,着重点是“资产”这两个字。我列了一些资产,做了一个对比,大家可以看到没有任何一个资产他们是共享所有属性的,没有,包括石油和黄金,前面四项是一致的,最后那一项还是不一致。大家可以看最后的数据,数据是非常独特的一种资产,尽管它是一个资产,它跟其他资产共享的属性很少。我们要知道第一个是可复制,其他所有的资产消耗了就没了,数据资产是唯一被用了仍然不会消耗的,这是我们认为的第一个原则,数据是有独特属性的资产,数据是一个资产。
正因为这样,微软在2016年以262亿美元买了Linkedin。Linkedin有什么价值?它基本没有资产,除了一栋办公大楼。但是,微软居然以溢价50%的价格把它购买进来,就是因为它的数据。大家再看一下Facebook2011年上市的时候,市值超过1000亿美元。美国那么多大飞机,那么多机场,它的估值也就426个亿,一个有那么多实体资产跟一个Facebook居然相差了三倍的价格?可想而知,这是都是因为数据产生的加以,所以数据确实是一个资产。
第二,数据的价值可以也应该用经济术语来表示。数据到底有什么价值?我们搞数据管理的目的是为了监管。现在,仍然还为了监管吗?不对,大家可以看一看,下面写着两条:
1.我们要通过为业务赋能实现价值,大家都知道,监管就是其中的一部分,数据的价值在哪儿?通过为业务赋能。从去年开始,数字是生产要素。
2.通过数据的交易直接实现价值。
最近,我们协会和好几家机构一直在搞数据交易、数据确权和数字价值评估的事情。我们以前讲数据价值的实现是通过业务赋能,大家千万别忘了,从去年开始,数据价值的实现另外一部分就是通过数据交易。北京已经有数据交易所了,我们上海也有,浙江也有,最近山东也会做一个交易所,其实就是数据交易。关于这个,我们南方电网、光大银行等至少两家央企做了数据价值评估的模型,发改委已经批了,认为这两个模型挺好的。这是第二点,数据的价值可以用经济术语也应该用经济术语来表示。
第三,数据管理意味着对数据质量的管理,我们认为数据的质量是一切的一切。给大家一个数字,这张表是我每次都会讲到的。我们协会在2019、2020年,在美国1000家企业做了调查,75%跟数据相关的项目全部失败了,最近的数据好像说80%的项目都失败了,比我们的数字还高。原因很多,最核心的原因是数据质量。这是美国Experian智库的数据,他的调研认为美国平均任何一家企业都有29%的数据有这样或者那样的质量问题。29%,这是一个相当大的数据。
正因为数据质量不行,Garbage in、Garbage out,我们这个知识体系里面一直认为没有好的质量数据,还不如不用。我们去了一家医疗机构,他们已经有26个T的数据,已经收集好了,他们的老大跟我说,他们不敢用。两个原因:
1.医疗数据,这个数据特别敏感,而且已经发生事故了,导致人命了。
2.他们对自己的数据质量根本没有信心。
26个T的数据,没有数据质量,仍然没有用。可想而知,如果今天数据质量不好,还不如不用。这是第三点,我们非常强调数据质量,数据管理的核心点就是数据质量的问题。
第四,管理需要元数据,这是我自己的体会。尽管我回国时间不是很长,在美国时间主要以搞金融数据为主,回来以后我确实看到一个现象,跟大家分享一下,我觉得政务数据都是从数据资产目录开始,忽略了主数据。泛工业领域基本都是从主数据开始,忽略了元数据,这是我的感受。
最近和许多大数据局、企业走得比较多,如果企业的项目,首先上来的就是主数据,有没有元数据?基本没有。政务数据恰好相反,所以现在政务数据,包括东部沿海几个发展发达的省市,目前我感觉这是两个极端。我问一个问题,数字化转型,数据管理这个项目到底应该从哪一个领域开始?我认为应该要从元数据开始,元数据是数据管理核心的部件。
我画了两张图,左手边的图是Peter Aiken,他是我们DAMA的主席,他说有四个阶段:
第一阶段,数据都有了,包括沈院士讲的数据安全各分析都也了。
第二阶段,数据架构、数据质量、元数据,有了元数据,数据治理开始了。
第三阶段,数据仓库、商务智能、参考数据、主数据,这是第三个阶段。
第四阶段,那边那一张图,也是我们知识体系里面提出来的,我们这个知识体系有160多人参与编写,这是大家智慧的结晶。这里面有一个依赖性,Dependency,最底下的是最底下的是元数据、数据安全、数据架构和参考数据,到了第二步,数据质量、数据设计、集成和操作,一直到了顶部才是主数据。我认为从数据项目的管理应该从哪儿开始?如果纯粹从零开始,真正做的首先是元数据。
元数据要把自己有的家底,要把自己有多少数据,这些数据在哪儿,有什么价值,把家底摸清,才有可能做其他的研究,这是基本的情况。原来经常有人问我们,数据管理到底从哪儿开始,不管对不对,至少我们这个协会是这样认为的,起点应该是在数据的元数据开始。没有元数据,我们认为数据管理很难进行下去,这是我们的第四个观点,数据管理需要元数据。
第五,数据管理需要规划,没有规划不行。我们的知识体系里面提了几个:
1.顶层设计需要基于框架,没有框架会走偏。
2.基于一定的原则,今天我讲的12个原则就是其中之一。
3.要三到五年的规划,这是我们协会建议的情况。具体落地我们需要小步快跑,对标成功的案例,总体而言,一定要有这样一个规划。
从业务的角度来讲,大家可以看一下我画了一张图,美国咨询公司都会用的关于数据化转型的图,从业务的角度,我们要有业务场景,这个业务场景到底怎么做?所以有一个图,这就是一个框架。我们如何来设计我们的业务场景图。
从技术层面,这是另外一张图,也在我们的知识体系里面,这张图是湖仓分离,现在都在讲湖仓一体化、云机一体化,这都是一些新的趋势。不管怎么样,当我们在做数据管理的时候,一定要有这样的框架作为我们的指导,没有这样的框架几乎肯定会走偏。这并不是最新的框架,但是不管怎么样,这是前一段时间甚至到今天为止我们仍然普遍使用的框架。
第六,数据管理是驱动信息技术决策。换句话说,数据管理这个工作或者数字化转型这个工作应该谁来做?肯定需要业务部门驱动,由IT部门落地,绝对不可以倒过来,倒过来成为75%,这一点我们非常强调,提出两个信息模型,一个叫作战略一致性模型,另外一个叫作阿姆司但模型,这两个模型讲的意思是一样的,一定要由业务来驱动数字化的转型和数据管理,绝对不可以倒过来。
第七,数据管理是跨职能的工作,这一段话,我是从国务院、国资委的通知里面摘出来的,运用5G、云计算、区块链、人工智能、数字孪生、北斗通信一大堆纯粹的技术,技术后面还有数据中台、业务中台、新型的IT架构模式,有哪一个部门可以把所有这些都搞定?搞不定。所以不但要有业务部门的参与,IT部门的落地,实际上业务部门里面,IT部门里面还有许多相互的重叠和支持,才有可能把这个数据管理真正落地,这个数据管理是跨职能的工作,没有任何一个单独的部门能够把这件事情做好,这是我们坚信第七个原则。
第八,数据管理需要企业级的视角,这个企业级就是我们集团的层面。这里有一句话“加快形成集团级数字技术赋能平台”。最近我去了一些央企,这些央企的二级机构和三级机构难道真的没有信息中心吗?老早就有了,我们出国的时候,1990年讲四个现代化,其中一个就是信息化。老早就有了,我们今天再做这个还有多大的意义?很有意思,今天讲的基本都是从集团层面讲数字化的转型,都在集团层面,而不像以前那样是某一个部门,需要从企业的角度,整体的角度来做。
最近,DAMA的群里面也在讨论,数据中台是不是已经死了?我个人认为没有,数据中台有很多很好的概念,并没有死。尽管在美国没有数据中台这个概念,但是数据中台其中有许多很好的理念我认为并没有死。当然,我们现在可以继续讨论这个问题,数据建模和影射如何来做?你做数据建模的时候,像个人、人和组织这样的表是不是要综合起来?最大公约数这个概念到底怎么理解?哪些数据在集团的层面,哪些数据可以在二级机构层面怎么来做?数据孤岛为什么难打通?难打通就是因为缺乏企业的视角。你做你的,我做我的。
这个表是我们DAMA培训材料里面的一张表。大家可以看到三个机构,采购部门、生产部门、公司居然用的是完全不同的代码和描述,基于这个理由,你怎么知道它是什么产品。如果我的二级机构用了不同的名称,买回来一看是同一个产品,造成的损失是什么?你的库存大量怎么。从这里可以看出来,没有一个企业视角,数字化转型等于零,发挥不了作用,这是一个很好的案例,所以我把培训教材里面的图放到这儿,这里涉及许多问题,数据中台、最大公约数,数据孤岛怎样从建模的角度、规划的角度把它打通。
第九,数据管理需要多角度的思考。这个图是John Zachman画的,John Zachman是我们协会的院士之一,他的儿子仍然和我们的协会保持非常好的合作关系。这张图是他画的,这张图能够帮助我们真正落地吗?它不能帮助我们真正落地。但是好的地方是它能够从不同的维度告诉我们,当我们做数据管理、数据架构或者数字化转型的时候,多方面都要考虑到。所以,不管是谁的框架,我认为这些框架都给了很好的参考体系,让我们能够知道需要多角度的思考。
第十,数据管理需要全生命周期的管理。我只画了一个数据安全,沈院士也在提数据安全,我们认为数据安全远远不止用的时候要有数据安全的问题,实际上它有一个生命周期。从数据的采集、传输、共享到最后的消化,都有数据安全的问题。
第十一,数据管理需要纳入与数据相关的风险,这是我们这个知识体系当中和其他理论很不一样的地方。其他的地方强调的是数据是黄金,是石油,我们不否认,但是我们这个知识体系里面更加强调数据作为一种资产,它同时也是一个风险。所以,我们这里讲了伦理的风险、法律的风险,法律的风险从GDPR、FTC,我们国家最近出了两个法律,会有法律的风险,如果我们不管理数据的风险,就会有那种可能性。
伦理的风险在哪儿?伦理的风险在科技向善。最近,我们跟中国企业家协会聊科技向善到底是什么意思,我们总结出来包括四个方面:尊重他人、行善原则,公正、尊重法律、公共利益,我们认为有四个伦理的原则,如果没有遵守法律伦理的原则,我们也会遭到巨大的风险。所以我们认为数据是风险。
第十二,有效的数据管理需要领导层承担责任。我们一再讲数字化转型,各方面是一把手的工程。我们到今天,仍然相信数据管理和数字化肯定是一把手的工程,没有一把手的参与,那个项目大家千万别参与,又会是75%。
我顺便讲CDO,CDO是1988年我们首次提出的概念,从2009年开始,美国许多州有了CDO,2014年DAMA的英国分会进一步明确了CDO的职责、权限等等,现在到处都是。包括广东、江苏、浙江、山东、上海都在搞CDO,特别是广东省在搞CDO的试点,风风火火。最近,我们有一本书也会出,就是《THE CDO JOURNEY》,这是DAMA中国分会翻译的。我们认为从数字管理这个角度而言,数字化转型角度而言,必须是一把手的工程,CDO恰好可以扮演这样一个抉择。我们认为CDO最近几年,在国内会有很大的市场。
快速总结一下,有人会提出疑问,信息化和数字化到底有什么区别?数字化会不会是信息化旧瓶装新酒?我大概做了一个对比。实际上,二者确实不是一个旧瓶装新酒的概念。从导向、目标、业务创新等等都不一样,所以我这里大概做了一个总结。
最后,数据作为生产要素如何实现它的价值?数字化的转型也好,数据管理作为一个具体的项目也好,我认为首先要有一个现状,要有一个评估,所以我们国家的DCMM就是一个非常好的评估模型。除了DCMM以外,现在包括金融数据、政务数据成熟的评估现在都出来了,DCMM原来更多是为制造业评估,现在在金融行业、政务等等各个领域里面都已经出来了,我认为现状的评估是非常重要的一部分工作,在那个基础之上,我们要有一个数据管理,当然,那个数据管理和数据治理的概念到底有什么差别或者相同点,我们线下可以再讨论。我们协会一直用数据管理这个概念,数据治理是数据管理当中的一部分。
到底该怎么做?比如说数据的质量、数据标准,数据建模、资产目录到底怎么编写?我们浙江省最近在搞的是一体化数字目录平台等等,有许多创新在做。这是第二步的工作。我们认为数据一定要管理企业。到了第三步是数据流通,包括数据开放,数据的共享以及跨境的数据交易等等,包括上海临港就在做这方面的工作。从这个领域里面来讲,数据最后一定要能够用起来才会有它的价值。所以我们认为有了这四个步骤,才能真正完成数据治理的项目或者转型的过程。
我的介绍大概就到这里。谢谢大家!