如何在业余时学数据分析?

4154
4

CC化腐朽为神奇 数据达人Lv4

发表于2018-6-6 09:43

楼主
我是一个web前端开发者和rails程序员,计算机专业出身,掌握Python、Ruby、C、Java编程语言,具有较为扎实的计算机理论基础。
现在工作之外的时间里想学习一下数据分析或者数据挖掘。现在大数据这个词搞得蛮火的,不少公司也有在招聘数据分析员。
抱着「技多不压身」的想法我也想稍微学习一下。说不定以后的工作也会需要。

最近看过此主题的会员

没人知道吗

请教我python

yangqh

瑞艾

包子头

小明

admin

aboutgeng

太阳当空照

4个回答

只看楼主

太阳当空照 小试身手Lv3

发表于2018-6-6 09:57

只看该作者

取消 关注该作者的回复

沙发

作者:保一雄
来源:知乎

来写一个非计算机/统计背景出身的人,如何利用业余时间学习数据分析的技能吧。
数据分析将会作为一门通识技能,进入越来越多的不同工作岗位中。毕竟“技多不压身”,掌握数据分析,一方面可以提升自己相应的业务能力,另一方面也可以让自己建立一种data-driven的视角,去思考各种问题。
关键词:非科班 + 业余时间 + 数据分析
结合自身的经历,我想从基本技能+动手实践两个角度谈谈。
基本技能不论是学什么,还是需要先有一个大的框架。对于学习数据分析而言,需要的技能模块有统计基础+数据库知识+编程能力
统计基础
理工科的学生在本科阶段学习过概率论与数理统计,单从做数据分析的角度,其实已经够用了。那么在业余时间里,我们需要有一本书可以随时查漏补缺,《深入浅出统计学》你值得拥有。
数据库知识
关系型数据库很重要,因为在学习数据分析的初期甚至很长一段时间,你接触到的数据都存储在关系型数据库中,需要学习SQL语言去进行数据的查询。SQL的上手很快,强力推荐《SQL必知必会》,整本书通俗易懂,是学习SQL语言的不二之选。我当年入坑也就是这本书开始的。个人觉得,学习数据库的本质就是在学习一种与数据打交道的逻辑思维与能力。而且在编程中的很多思想都是和SQL之间相通的,比如:SQL中对data进行group by的操作,这个在Excel里类似于透视表,在Python/R中也有相应的group function去处理数据。甚至在以后的进阶过程,你会接触到分布式数据库和所对应的no-SQL语句,本质上都是和关系型数据库及SQL相通的。
编程能力
Excel --- 别拿Excel不当干粮,之前看到过一个段子:投行的童鞋们用Excel根本不需要鼠标,暂且放在这里调侃一番。不过,Excel里面的透视表(Pivot Table)确实是做数据分析的必备技能。透视表可以帮你迅速汇总数据,看到各类型数据的直观特征就像是让你站在了一个更高的视角上去看你的数据。作为进阶,Excel自带的函数,各种插件,以及VBA也是很好的工具,将Excel用到极致也不是不可以。
Python --- 当数据量大到用Excel打开都要好久的时候,或者我们想进一步提升能力的时候,需要学习一些hardcore技能,即用编程语言做数据分析。这里主要有R和Python两大流派。我个人推荐Python,一方面Python代码简单易懂,容易上手;另一方面学习资料超级多。在这里推荐一本书,《利用Python进行数据分析》,这本书涵盖了利用Python做数据清洗,数据可视化及分析的技能点,可以作为一本工具书随时查阅。
难道学习数据分析就一定要掌握这些基本技能吗?答案是,并不一定在开始的时候就全部掌握,学习数据分析最重要的方式就是动手实践,get your hands dirty at first。结合楼主的提问,重点讲讲动手实践的部分
动手实践:这一部分其实就是在回答题主的几个问题:

  • 从哪里弄到有分析价值的数据? --- 平台
  • 在开源社区有没有开源项目适合用来学习数据分析?
  • 可以自己动手做个什么项目来实践
  • 好的平台社区:既然是利用业余时间学习数据分析,那么一个好的平台社区将会起到事半功倍的效果。美国有Kaggle,中国有Kesci; 美国的kaggle是全世界做数据科学/数据分析的爱好者/从业者的聚集地,上面你可以看到各种大神的数据分析/挖掘项目,拿来自己练练手。中国现在也有了数据分析学习社区---科赛网Kesci; 在这里可以找到很多开源数据集启动你的数据分析之旅。What's more, Kesci有一个目前国内独有的在线数据分析平台,K-lab。当你在社区内看到不错的项目之后,可以fork过来在K-lab上面做自己的分析项目并在社区内做展示。我们也在推动从0到1学习数据分析的活动,陪伴中国的第一代数据分析师成长。
  • 随时查漏补缺:在这一路实践的过程中,你可能会遇到各种问题,知乎就是一个强大的搜索引擎,有很多大牛写的数据分析文章;当然,如果你英文能力强的话,欢迎copy and paste from StackOverflow, 你可以直接搜索你在写代码做数据分析遇到的各种问题,总有一款答案适合你。
  • 再进一步升级:这一路实践就像是游戏里打怪升级的过程,比如你发现自己对统计的知识点不是很清楚,你开始回过头去看统计学书籍;你发现数据存储在分布式系统里面,你开始学习no-SQL的知识;你发现自己对某一行业比较感兴趣,你开始通过数据分析去了解一个行业;你发现自己已经不满足于利用现成数据作分析,你开始学习使用爬虫去抓取数据作分析。逐个击破知识盲区,滚雪球式累积,这也是学习数据分析的精髓。
小结学习数据分析本来就是搭好框架体系不断累积知识不断hack技能不断提升分析水平的过程。哪怕是业余时间学习,假以时日,亦可成大器。也许正因为不是科班出身,所以在奔向远方的道路上才会永不知足,永不疲倦,“stay hungry, stay foolish”。



aboutgeng 数据小白Lv1

发表于2018-6-6 17:26

只看该作者

取消 关注该作者的回复

板凳

推荐一本书给大家,《Head First Data Analysis》电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。

小明 初学数据Lv2

发表于2018-6-6 18:13

只看该作者

取消 关注该作者的回复

地板

数据分析,不论使用什么样的工具,使用什么样的方法,不论是Excel,还是Python,还是MySQL,都是工具,目的只有一个——解决一个问题,或者给一个决策提供依据。所以,学习数据分析的第一步,是要考虑,我要用数据,解决一个什么样的问题?这点如果没有考虑清楚,只是跟着网上的教程学习爬虫,学习数据清洗,然后把那些公有的统计数据做成绚烂的图表,又有什么用呢?

包子头 初学数据Lv2

发表于2018-6-7 09:03

只看该作者

取消 关注该作者的回复

5#

学习数据分析本来就是搭好框架体系,不断累积知识,不断hack技能,不断提高,然后明白自己需要解决什么问题,带着问题去学习。

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

400咨询:400-0011-866

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号