[主数据] 相似度分析的计算逻辑: 1、先设置字段的权重, 2、所有数据两两进行权重的计算,得到所有数据两两之间的相似度 3、按照相似度区间统计相似的数量,相同的要去重 是按照这...
2067
3
-
mpp111 数据小白Lv1
发表于2022-11-24 10:43
悬赏1
已解决
楼主
最佳答案
本帖最后由 两包辣条约吗 于 2022-11-24 15:33 编辑
1、相似度区间分布,以10%为一个区间,范围为0-100%;以柱状图的形式展示区间内的相似数据对。
2、原始数据是分析相似的一条数据,这里显示的他的id和name;数据量就是在你选定的区间内有多少跟他相似的
1、相似度区间分布,以10%为一个区间,范围为0-100%;以柱状图的形式展示区间内的相似数据对。
2、原始数据是分析相似的一条数据,这里显示的他的id和name;数据量就是在你选定的区间内有多少跟他相似的
3个回答
本帖最后由 两包辣条约吗 于 2022-11-24 15:33 编辑
1、相似度区间分布,以10%为一个区间,范围为0-100%;以柱状图的形式展示区间内的相似数据对。
2、原始数据是分析相似的一条数据,这里显示的他的id和name;数据量就是在你选定的区间内有多少跟他相似的