关于数据挖掘,你了解的有多少?

1973
0

抠脚女汉子 小试身手Lv3

发表于2018-9-17 11:38

楼主
在电影《美丽心灵》中有这样的一个场景,由罗素·克劳扮演的CIA探员约翰·纳什,在黑板上把涉及的事件数据、特征关联起来,一步步推理,抽丝剥茧,直到最后破解案件。这基本上可以看成是“数据挖掘”的内容,当然,除了不必像罗素·克劳一样在脑海中操作这一切。


简单来看,数据挖掘是将数学、统计相关的技术应用于存储库中的大量数据(即大数据),以获取数据间的相关性及趋势。

01
数据挖掘如何发展而来?

可以说,大数据、数据挖掘都是一种前瞻性的观点。

起初,我们是“站在肩膀”上进行数据分析:浏览历史数据,试图搞清楚我们是如何发展到现阶段,过去什么因素发挥了作用、什么因素没有发挥作用,以及原因又是什么。

不可否认,这是有意义的,但是存在局限性:尽管你可以从过去失败或者错误中吸取教训,但环境是一直在变化,上个月发生的事可能在现在来看并没有太大参考价值,远不及当下正发生的经验价值大,又或者,能预测明天会发生的事则是更好的。

所以,我们进入了数据挖掘时代,关注预测数据 ,而不仅仅是数据分析。

随着数据挖掘技术越发成熟,我们可以展望未来,将挖掘技术映射到未来,应用所掌握的知识面对即将发生的情况。

02
为什么数据挖掘有价值?

掌握当下最准确的信息并预判未来,对企业而言,好处显然是巨大的。

一旦可以判断即将发生的事情,你可以做出最万全的计划,为最坏的情况做出准备,在需要时重新分配或扩展资源、有效分配预算、调整订单量和库存要求等内容,而且从团队人员配比、财务状况上,可以帮助你尽可能做到精简有效。

当然,所有这些都对企业的业务成功产生巨大影响 。

正如Sisense的首席数据科学家Nir Regev所解释的:

“对于任何数据挖掘过程,都需要从某种假设开始,以便知道要关注什么。你不能收集组织中的每一条数据,这是效率低下的表现,你要收集的是与你的假设相关的数据。然后,使用Python或R等工具深入挖掘数据,以执行EDA(探索性数据分析),然后你就可以从数据中提取洞察力和功能。没有特定目标的初步假设(例如减少客户流失),你只会迷失在数据之中。”

03
数据挖掘在实践中如何运作?

让我们以零售业为例。

想象一下,你现在是一家零售连锁店的店长,在营业过程中,会在与外部供应商、客户的互动中产生大量的数据,比如入库记录、出库记录、销售记录带来的库存数据、销售额数据等等,而所有数据都被转移到庞大的数据仓库中,但只是拥有这些信息对你没有多大帮助,你必须知道这些数据背后对业务的价值。

使用数据挖掘技术,你可以透过数据识别客户购买行为模式,了解客户购买习惯,例如他们购物的时间是什么时候和购买的产品以什么为主,同时你可以看到行为趋势如何逐月变化,以及每个季度的变化。有了这些信息,你就可以开始对下一个月、下一个季度的门店情况做出详细、准确的预测,包括哪些产品最畅销,以及何时会迎来门店最忙的高峰期。

接下来,你就可以规划员工的轮班表,在高峰期之前发布招聘计划,安排好兼职人员,保证在最忙的时候员工不会过度加班,公司也无需支出过多的加班费用。同时,你可以提前增加库存订单,足够长的交付时间可以避免临时加货带来的高额运输费用,也可以避免过度订购错误导致库存过剩的高仓储成本。

让我们再举一个例子:一个云托管的SaaS服务商,其平台被全球数以万计的企业使用。在这种情况下,平台每天都会生成大量数据,包括从登录时间到用户行为,系统中标记的错误等所有内容。

通过整理和挖掘崩溃报告中的数据,你可以很快建立导致平台出现问题的模板,发现系统中的错误或弱点,处理某些设备或操作系统时出现的问题,或哪些操作最能引发问题。利用这些信息,你可以不断改进产品供应,消除故障,持续为客户提供服务,并防范网络威胁。

更重要的是,通过全面了解用户的普遍使用时间和常用工具、功能等因素,你可以:
a)确定下一步采取的产品策略;
b)根据客户偏好更有效地进行营销;
c)预测每个地区的需求何时最高,确保分配足够的资源和服务器来进行处理。

从以上的举例中看出,如果你想收集信息,那么你寻找的所有答案可能深藏在那些混乱的数据中,而数据挖掘就是让答案显现的一种方式。

04
答案已经在那里,只需找到它


数据挖掘通过分析数据库中已有的数据来解决问题...但它仍然需要正确的技能、工具和见解来正确构建问题,并理解所有问题。

这边,我先提出一个常见问题:如何在激烈的市场竞争中提高客户忠诚度?

你要做的第一件事就是弄清楚“善变的客户”是什么样的。通过挖掘已有的关于客户行为和特征的所有数据,你可以形成总体的特征图,比如什么因素导致客户选用其他的产品,与依旧选用该产品的忠实客户相比,有什么区别特征等等。

一旦你有了答案,你可以利用这个识别出“变幻无常”的客户,然后,当你判断出他们犹豫不决考虑换产品之前,就找到维持其兴趣的办法,预先解决问题。比如“特殊处理”,针对这部分客户推出特定产品功能,可能这些功能价格较高无法全面推广,但专门用来保留住客户,还是值得的。

就数据本身而言是不够的,这只是“原材料”,需要你精心设计以解决重大问题。

05
你做需要的工具

数据挖掘通常需要强大的编程语言,如Python语言或R语言,后者是一种非常流行的开源语言,用于对庞大数据集进行复杂的统计和数据分析。

当你将此编程语言与BI平台结合使用时,效果最佳。这使得可以混合多个数据集并在BI平台中准备数据,将其传输到R进行分析然后将其重新引入BI解决方案以显示结果。结合起来,是一种灵活而强大的方式,可以推动预测分析。

06
数据挖掘的下一步是什么?

随着数据集的出现,数据挖掘变得越来越复杂。将来,企业内部存在的数据源会越来越多,将以更多格式、从更多设备和地理位置收集更多原始数据。所以在正式开始数据挖掘之前,企业还需要做很多整合数据的工作。

与此同时,业务主导的数据分析范围将越来越大。只要能够弄清楚如何有效地挖掘、操纵数据,你将能够比以往更多地了解业务,帮助你准确理解每个部分如何组合在一起 ,包括每个数据行动和业务决策如何融入其中。

数据交互的方式也将变得更加多样化和智能化,包括自然语音、机器学习功能等,实现预测分析的同时,大量的流程实现自动化。

这也是为什么数据挖掘需要有能够处理此范围和需求的BI工具的支持。你需要一个快速且可扩展的BI解决方案,以应对你抛出的大量数据,并且足够灵活,可以添加想要的任何数据源,能够支持塑造数据挖掘领域的新发展,比如从机器学习到自然语言处理(NLP)。

对企业而言,要在日益激烈的市场竞争中保证持续发展,不仅需要数据挖掘模式,将其转换为可操作的洞察力,更多的是需要迅速与智能。
转自 | 商业智能洞察
文章来源 | sisense

最近看过此主题的会员

范文杰

lii_chen1234

v笑向前走

chenzy

一点一点

raincc

小曦

esen_3BRNEVBGO0RQ

wuqiong

小由菜

abixuexi

sunwl

admin

小亿

挨踢妹

a1ex

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

400咨询:400-0011-866

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号