-
qinzhq 初学数据Lv2
发表于2020-2-6 11:04
悬赏1
已解决
这张图中有一点不明白
视频中讲的是库表2的粒度与库表3的粒度相同,因为仓库类型是仓库编码的一个属性。这里我可以理解为表2和表4的维度相同,所以粒度也相同吗?
库表2的粒度与库表4的粒度不同,也是因为仓库类型,此时库表4中,没有了仓库编码维度,那么仓库类型也就不存在是谁的属性问题,那么仓库类型此时就是一个维度对吗?
这样一来库表2的维度和库表4的维度一样,粒度为什么不一样?
11个回答
2和4虽然都拥有相同的维度,但是可能存在日期,一个是日,一个最细粒度为月的情况,这样维度组合,最细粒度的维度是不同的
大白 发表于 2020-2-6 11:10
2和4虽然都拥有相同的维度,但是可能存在日期,一个是日,一个最细粒度为月的情况,这样维度组合,最细粒度 ...
如果这么说的话,表2和表3也可能存在时间维度的不同粒度,比如表2到日,表3到月,那这样以来,表2和表3的粒度不就也不一样了吗?
首先我们要理解仓库编码和仓库类型的关系,仓库编码代表的是一个个仓库个体,仓库类型是代表仓库所属的类型,一个仓库只属于一种仓库类型,但是一个仓库类型会包含多个仓库个体,他们不是一个维度,所以粒度是不一样的。
大白 发表于 2020-2-6 11:10
2和4虽然都拥有相同的维度,但是可能存在日期,一个是日,一个最细粒度为月的情况,这样维度组合,最细粒度 ...
例子中的日期维度,这里指的都是一个维度,要么都是日,要么都是月。
每一个仓库都有仓库类型的属性,先来看库表2和库表3,在库表2中含有仓库编码用来唯一标识一个仓库,假设我们在表中在添加一个字段是数据仓库类型的字段,那么原有表中的记录数是不会发生改变的,因此他们的粒度是一致的。而库表2和库表4统计的维度是完全不一样的,库表2可以把他理解成存储的是明细数据,而库表4相当于一个汇总数据,所以粒度不一致。
qinzhq 发表于 2020-2-6 11:33
事实表的粒度和数据记录的条数之间是什么关系,我有点不明白
可以看下9楼,基本就是他讲的这个意思。多个维度之间组合确定粒度的时候,如果维度字段之间有关系,那么我们会以最细的那个维度作为组合去确定事实表的粒度,比如例子中的仓库和仓库类型维,他们之间仓库更细,那么粒度是由仓库维来确定。所以你在表3中加入仓库类型或者去掉仓库类型,表数据量是没变化的。