-
宋宋 数据领袖Lv6
发表于2020-5-18 11:35
楼主
本帖最后由 宋宋 于 2020-5-18 11:44 编辑
作为一个在海外学数据科学(data science)的硕士来浅谈一下,我本科是学金融的然后现在学习数据科学,刚上完第一学期的课,基本上是又要学高数又要学编程还要学数据库管理,半年内学会了python,linux,还有sql,高数本科就会,不算新东西.
总体来说东西很多,每一个学到最后都能给你找一份不错的工作,不管是成为数据库管理,码奴,还是往金融方面做一些量化,其实都是可以的,至于工资,我也是冲着高工资才去选这个专业的呢……然后关于前景,前景其实一般吧,比如当年人人学金融,然后今年北上的金融界全体爆炸了都在裁员(还好我研究生没继续学金融)未来都是不可知的,作为韭菜,大家还是多学一门技术多一口饭,强烈建议多学学人工智能和区块链技术(不是国内那群骗子口中的比特币,学一学加密算法之类的)
数据科学本质上是传统的统计学的升级版。早在2000年呆斯坦福的David Donoho和Elements of Statistical Learning的作者们就提出了把statistics改名为data science,这样有利于学科的宣传和发展,statistics这个词不够好听。
传统的统计学包括数理统计、应用统计等,比如数理统计非常理论,构造各种估计方法,有各种各样的证明。哪怕是偏计算类的蒙特卡洛,也要证明各种收敛性,类似计算数学。
应用统计更多是在生物方面,其他领域如经济领域有计量经济学,虽然跟统计学接近,但整体上还是经济学家占优。但在生物领域,有专门的生物统计系,统计学家不会输给生物学家。
1995年以来,支持向量机、决策树、深度学习等蓬勃发展,这些都属于拟合数据的模型,或者说预测模型,跟传统的统计学关心的可能不大一样。
传统的应用统计学一般处理小样本问题,这样需要就模型作出很多假设,贝叶斯统计很多都是先验估计,也是因为数据不足。但到了人工智能的问题,图像识别之类的,样本量翡翠大,几百万上亿的,可以暴力拟合复杂的模型,而且不会过度拟合。
近年来GPU硬件发展迅速,可以很快拟合出模型,调调参也方便了,而且都是全局最优。样本之间差异不大,因此只要训练集可以拟合好,测试集不用太担心。
传统的统计学或计量经济学更多是为了解释,比如采取这个措施会让GDP增加1%,疫情对GDP的影响是-5%等,都是估计得出,没法预测,历史上没多少疫情可以拟合学习。
好像说偏了,回到就业。
这个学科更多是学习1995甚至2010之后才出现的内容,会比较前沿,可以尝试应聘互联网公司的算法工程师、数据科学家等岗位,也要注意刷leetcode和练习编程,基本的收集整理数据的工作自己要能做。
关注电商、物流、自然语言、互联网等方向的就业。就业前景比传统的统计好。
来源互联网
作为一个在海外学数据科学(data science)的硕士来浅谈一下,我本科是学金融的然后现在学习数据科学,刚上完第一学期的课,基本上是又要学高数又要学编程还要学数据库管理,半年内学会了python,linux,还有sql,高数本科就会,不算新东西.
总体来说东西很多,每一个学到最后都能给你找一份不错的工作,不管是成为数据库管理,码奴,还是往金融方面做一些量化,其实都是可以的,至于工资,我也是冲着高工资才去选这个专业的呢……然后关于前景,前景其实一般吧,比如当年人人学金融,然后今年北上的金融界全体爆炸了都在裁员(还好我研究生没继续学金融)未来都是不可知的,作为韭菜,大家还是多学一门技术多一口饭,强烈建议多学学人工智能和区块链技术(不是国内那群骗子口中的比特币,学一学加密算法之类的)
数据科学本质上是传统的统计学的升级版。早在2000年呆斯坦福的David Donoho和Elements of Statistical Learning的作者们就提出了把statistics改名为data science,这样有利于学科的宣传和发展,statistics这个词不够好听。
传统的统计学包括数理统计、应用统计等,比如数理统计非常理论,构造各种估计方法,有各种各样的证明。哪怕是偏计算类的蒙特卡洛,也要证明各种收敛性,类似计算数学。
应用统计更多是在生物方面,其他领域如经济领域有计量经济学,虽然跟统计学接近,但整体上还是经济学家占优。但在生物领域,有专门的生物统计系,统计学家不会输给生物学家。
1995年以来,支持向量机、决策树、深度学习等蓬勃发展,这些都属于拟合数据的模型,或者说预测模型,跟传统的统计学关心的可能不大一样。
传统的应用统计学一般处理小样本问题,这样需要就模型作出很多假设,贝叶斯统计很多都是先验估计,也是因为数据不足。但到了人工智能的问题,图像识别之类的,样本量翡翠大,几百万上亿的,可以暴力拟合复杂的模型,而且不会过度拟合。
近年来GPU硬件发展迅速,可以很快拟合出模型,调调参也方便了,而且都是全局最优。样本之间差异不大,因此只要训练集可以拟合好,测试集不用太担心。
传统的统计学或计量经济学更多是为了解释,比如采取这个措施会让GDP增加1%,疫情对GDP的影响是-5%等,都是估计得出,没法预测,历史上没多少疫情可以拟合学习。
好像说偏了,回到就业。
这个学科更多是学习1995甚至2010之后才出现的内容,会比较前沿,可以尝试应聘互联网公司的算法工程师、数据科学家等岗位,也要注意刷leetcode和练习编程,基本的收集整理数据的工作自己要能做。
关注电商、物流、自然语言、互联网等方向的就业。就业前景比传统的统计好。
来源互联网