如何进行数据分析?

1892
0

冷色系 小试身手Lv3

发表于2019-1-17 18:01

楼主
本帖最后由 冷色系 于 2019-1-17 18:11 编辑

作为一名数据分析师,数据分析主要分为六步:
第一步:什么是数据分析

      数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价信息的一个过程。

      数据分析,顾名思义,数据加分析。也就是说必须要以数据为先,分析为后。对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。


第二步:数据分析类别
      1. 描述型:发生了什么?
       这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。一个例子是每月的利润和损失账单。类似地,分析师可以获得          大批客户的数据。了解客户(如,30% 的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的          信息。

      2. 诊断型:为什么会发生?
       这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。设计良好的商业信息                    dashboard 整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

     3. 预测型:可能发生什么?
      预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测       模型完成。预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,       我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。
       在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

     4. 指导型:我需要做什么?
        在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定         要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。

第三步:数据分析方法
      1、探索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。
      2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。
      3、推断分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。

第四步:数据分析流程
      1.明确目的和思路
       首先明白本次的目的,梳理分析思路,并搭建整体分析框架,把分析目的分解,化为若干的点,清晰明了,即分析的目的,用户什么样的,如何        具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标需合理搭配使用)。同时,确保分析框架的体系化和逻辑性。
      2.数据收集
      根据目的和需求,对数据分析的整体流程梳理,找到自己的数据源,进行数据分析,一般数据来源于四种方式:数据库、第三方数据统计工具、        专业   的调研机构的统计年鉴或报告(如艾瑞资讯)、市场调查对于数据的收集需要预先做埋点,在发布前一定要经过谨慎的校验和测试,因为一旦        版本发布出去而数据采集出了问题,就获取不到所需要的数据,影响分析。
      3.数据处理
       数据收集就会有各种各样的数据,有些是有效的有些是无用的,这时候我们就要根据目的,对数据进行处理,处理主要包括数据清洗、数据转            化、数据提取、数据计算等处理方法,将各种原始数据加工成为产品经理需要的直观的可看数据。
      4.数据分析
       数据处理好之后,就要进行数据分析,数据分析是用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过       程。
       常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的问题。需要的话,可以再有针对性的学习SPSS、SAS等。
       数据挖掘是一种高级的数据分析方法,你需要掌握数据挖掘基础理论,数据库操作Phython,R语言, Java 等编程语言的使用以及高级的数据可        视化技术。要侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
     5.数据展现
       一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一        步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。

第五步:数据分析有哪些工具
      数据分析工具主要有:Microsoft HDInsight、Talend、亿信BI、R编程、IBM SPSS Modeler。





最近看过此主题的会员

esen_50U2PL1OSG1M

pandabuxizao

chenliwei

ddb

原来的我

向日葵

18282474942

Goofy高伯

btt132

hesj

17600457926

v笑向前走

w7222

kk.

hujuan

admin

名字真棒

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

400咨询:400-0011-866

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号