大数据小白概念篇之数据中台

1702
0

ever 小试身手Lv3

发表于2020-5-30 20:49

楼主
近年来说起大数据已经不算时髦的词汇了,但说到数据中台那应该是走在数据前言了,那么到底什么是数据中台呢,他跟数据治理,数仓什么的有什么区别呢,谁、在什么情况需要做数据中台呢?本白整理了一些自己学习和理解的过程,分享给其他有兴趣的小白同胞参考。
1、什么是数据中台?
数据中台概念最早应该是阿里提出来的,为了实现数据的分层和水平解耦,提供全域的数据服务。它是一套让企业将数据用起来的机制,一种战略和组织形式,依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建一套持续不断把数据变成资产并服务于业务的机制。
Ps:数据中台貌似还未出百度百科,所以说明这种新型数据概念还在沉淀中
2、数据中台与数据治理
人们将海量数据进行数据整理,数据清洗,确保数据规范统一,方便批量处理,同时植入对应的计算公式,把自己所需的数据模型提取起来,这一过程就是数据治理,一般含有元数据管理、数据标准管理、数据质量管理、数据集成管理、主数据管理、数据交换管理、数据资产管理、数据安全管理、数据生命周期管理等模块。
相对数据中台来说,数据治理是其中的一部分,数据中台可以分数据资产-数据治理-数据模型-数据应用服务4分部。
3、数据中台与数据仓库
数据仓库是“管理数据”,数据中台是“经营数据”,数据中台是为了提供服务而生。
数据中台从某个意义来说属于数据仓库的一种,都是要把数据抽进来建立一个数据仓库。但是两者的数据来源和建立数仓的目标以及数据应用的方向都存在很大差异。
从数据来源来说,数据中台的数据来源期望是全域数据包括业务数据库,日志数据,埋点数据,爬虫数据,外部数据等。数据的来源可以是结构化数据或者非结构化的数据。而传统数仓的数据来源主要是业务数据库,数据格式也是以结构化数据为主。
从目标来说,建立数据中台的目标是为了融合整个企业的全部数据,打通数据之间的隔阂,消除数据标准和口径不一致的问题。它不仅仅是汇聚企业各种数据,而且让这些数据遵循相同的标准和口径,对事物的标识能统一或者相互关联,并且提供统一的数据服务接口。就像做菜一样,按照标准化的菜名,先把所有可能用到的材料都准备好。而数仓主要用来做BI的报表,目的性比较单一。
从数据应用方面,建立在数据中台上的数据应用不仅仅只是面向于BI报表,更多面向营销推荐,用户画像,AI决策分析,风险评估等。而传统的数据仓库主要是面向报表,数据应用的建设就是传统烟囱式建设,每次都从头再来的开发方式。
最后,数据中台是建立在分布式计算平台和存储平台,理论上可以无限扩充平台的计算和存储能力。而多数的传统数仓工具都是建立的单机的基础上,一旦数据量变大,会受单机容量的限制。
4、谁需要数据中台
数据中台是企业数据战略的重要发展方向,通过采集、存储、计算,治理技术形成统一标准和口径的数据资产服务,可以解决数据孤岛、数据资产流失、数据服务能力不足、数据价值低的问题,最终使数据能够赋能业务场景、产生业务价值。
比如智慧城市就是一个比较契合的应用场景,数据是城市发展的新的基础资源,通过汇集各部门的数据,建立一个统一规范、安全可控、充分共享的城市数据资源平台,是实现数据资源跨区域、跨层级、跨部门的互联互通、融合共享的基础。
另外从概念上来讲,并不是只有大企业大项目才要做数据中台,它应该从小数据、小场景做起,逐渐让数据资源和应用有序和良性发展,这种与客户的业务、企业的结构和信息化发展阶段有着紧密的相关性的业务基础架构,很难用一个大而全的产品来一劳永逸解决的,而且长期规划的过程和沉淀。

最近看过此主题的会员

esen_4QBKSNNCFK

416643558

baimr

数据大白

guo1235

Olen

鱼鱼鱼鱼鱼

这是小可爱

dora232

esen_45AUI4GB4FG3

yil13033

疯狂表格

yxhc1111

hanson

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

渠道咨询电话:137-0120-6790

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号