-
GABRIELLE 初学数据Lv2
发表于2020-3-23 14:56
悬赏10
已解决
数据资产标签创建,有个帖子也提问相同问题,但里面提及的文档无账号密码无法查看,麻烦有账号或者内网相应文档链接的可以回答一下吗?或者写出相应创建标签的步骤~数据质量权重与评分卡作用对数据质量的作用是什么~
4个回答
每个规则在检查完毕后,都会根据检查的结果打一个分数,比如检查100条数据,有10条不符合这个规则,则该规则是90分。一个质检方案下会有多个规则,给每个规则分配权重之后,这个质检方案的整体分数,就是各个规则分数的加权平均分。一般情况,不同的质检规则重要性也不同,比较重要的规则,会分配大一些的权重。评分卡则是可以定义多套权重,不同的人员或者不同业务场景下,对于数据的关注点不同,所以质检规则权重分配可能不一样,通过评分卡可任意切换,得到符合场景需求的质检结果和报告
lvx 发表于 2020-3-23 15:16
每个规则在检查完毕后,都会根据检查的结果打一个分数,比如检查100条数据,有10条不符合这个规则,则该规 ...
谢谢回答~这个我自己也能大概理解,因为我发现在设置权重的位置上,无论填什么数都没有限制,比如我一个填1000 另外另个填10 出来的分数也没有差很多,并且在规则设置的位置有个全局权重/权重 全局这个是自己生成的,有三条规则,设置权重均为10,全局也自动变为10,这个东西是怎么生成的呢~
权重填什么数值确实没有限制,但是并不是说权重相差很大,最终分数就会相差很大,比如你改变权重的那条规则的分数如果和最终分数比较接近,那么就算那条规则的权重从10变成1000,最终分数也不会差很多。。另外关于全局权重,数据质量规则里面还有一个分组的功能,分组也可以分配权重,而全局权重就是根据该规则的权重以及该规则所在分组的权重综合计算而来的,这里给个例子你看下。