-
-
ppatclj 初学数据Lv2
发表于2020-8-4 18:06
悬赏1
已解决
楼主
数据工厂在构建数据仓库的时候,数据能构建到原始关系型数据库中吗?还是必须采集到默认比方petabase中去?
因为有些情况下,数据量暂时不是很大,而数据仓库整合数据的理念又很好,那是不是可以简化存储方式,仅保留数据工厂做分析的部分
因为有些情况下,数据量暂时不是很大,而数据仓库整合数据的理念又很好,那是不是可以简化存储方式,仅保留数据工厂做分析的部分
最佳答案
ppatclj 发表于 2020-8-4 18:46
嗯 就比方业务数据本身就在关系型数据库里比方mysql或者pg上,大数据数仓我网上了解了下各层数据一般不是 ...
可以在原关系型数据库中定义分层,只是一般不这么做。在数据集里面的每个主题集可以自定义所属分层已经对应的连接池是那个
5个回答
xxxl 发表于 2020-8-4 18:28
这句话没太懂,能再具体的描述下吗
嗯 就比方业务数据本身就在关系型数据库里比方mysql或者pg上,大数据数仓我网上了解了下各层数据一般不是构建在比方hive这些里的嘛,在我们这个数据工厂的话,是不是对应的就是在PetaBase中?但这就有个问题,如果数据量小的情况下是不是可以越过原本大数据的存储方式,改为在传统关系型数据库中构建数据分层?
ppatclj 发表于 2020-8-4 18:46
嗯 就比方业务数据本身就在关系型数据库里比方mysql或者pg上,大数据数仓我网上了解了下各层数据一般不是 ...
可以在原关系型数据库中定义分层,只是一般不这么做。在数据集里面的每个主题集可以自定义所属分层已经对应的连接池是那个
xxxl 发表于 2020-8-5 17:57
可以在原关系型数据库中定义分层,只是一般不这么做。在数据集里面的每个主题集可以自定义所属分层已经对 ...
一般不这么做,是因为分析性能会受到影响还是在功能上面会受到缺失?比如在各个产品(标签、质量等)功能的对接方面
ppatclj 发表于 2020-8-5 18:06
一般不这么做,是因为分析性能会受到影响还是在功能上面会受到缺失?比如在各个产品(标签、质量等)功能 ...
做分层是很少这么做,数据库上的具体影响您可以百度看一下,对于产品上影响不大