一文教你如何精准预测出2017年中国GDP总额

1168
0

小亿 管理员

发表于2019-8-15 15:02

楼主
网络互联设备的增长带来了大量易于访问的时间序列数据,越来越多的公司对挖掘这些数据感兴趣,从而获取了有价值的信息并做出了相应的数据决策。作为一家根植于数据的公司,Esensoft多年来致力于寻找如何管理日益增长的数据,帮助合作伙伴对市场做出预测分析。

*什么是时间序列
了解时间序列预测前,先看下图:


这是2012年6月时,FXSTREET网站对道琼斯指数未来两月的预测(红线标示)。这就是时间序列预测典型的应用场景。

时间序列是现实生活中经常会碰到的跟时间变化有关的数据形式。例如北京市连续一年PM2.5指数、某股票的股票价格、淘宝上某件商品的日销售件数等等。时间序列分析的目的是挖掘时间序列中隐含的信息与模式,并借此对此序列数据进行评估以及对系列的后续走势进行预测。

简单的说,时间序列预测就是寻找历史时间序列中的数据变化规律,以预测未发生时间的趋势

*时间序列测试方法
时间序列可以有这么几种形式:按分钟、小时、天、按季度、按月份、按年来排列的连续序列,而且序列是数值序列,不是名义序列。比如每天空气质量,每个季度的净利润,每年的销售额,中间不能有断序,不能有重合,严格按照时间轴来叙事。

时间序列依据其特征,有以下几种表现形式,并产生与之相适应的预测方法:
  • 长期趋势变化:受某种基本因素的影响,数据依时间变化时表现为一种确定倾向,它按某种规则稳步地增长或下降。使用的分析方法有:移动平均法、指数平滑法、模型拟和法等。
  • 季节性周期变化:受季节更替等因素影响,序列按固定周期规则性的变化,又称商业循环。使用的分析方法:季节指数。
  • 循环变化:周期不固定的波动变化。
  • 随机性变化:由许多不确定因素引起的序列变化。使用的方法有AR、MA、ARMA模型等



WonderDM内置了Holt-Winters(三次指数平滑算法),适用于季节性周期变化的时间序列预测。除此这外,通过内置的R算法包,还可以用ARIMA算法实现随机性变化的时间序列预测。

*时间序列测试的步骤
2017年已经过去,关心国家经济发展同学们一定很期待中国在2017年的GDP增长情况。接下来我们在WonderDM中介绍一下用Holt-Winters算法利用历史数据预测我国在2017年GDP表现如何,看看与实际的是否相符。

准备数据

我们从网上收集了从1990年到2016年中国国内生产总值的数据集。通过图形探索线状图查看数据变化趋势:
通过上图可以看到,GDP随年份呈指数增长趋势,存在一定的规律性。

训练模型

先创建一个挖掘过程,选择时间序列Holt-Winter,进入挖掘过程界面。
我们选择准备好的“中国GDP”数据集,选择YEAR_字段为时间戳字段,GDP_字段为预测字段,因为我们数据集数据并不太多,设置所有数据参与预测(训练数据最大行数大于实际数据行数即可)。因为GDP是按每年为一个周期,季节周期设置为1。预测期数为1,只预测2017年。时间戳格式为年份yyyy。设置完后,点击”训练模型”菜单查看训练出来的预测模型。






如上图所示,系统预测出2017年,我国的GDP为11.43万亿美元。图上实线为历史数据,虚线为预测数据,可以看出,从2006年开始,预测的数据比实际数据偏低。同时可以看到预测值的平均绝对误差为22.95%,有点偏大,而置信区间没有。这些都意味着,预测的2017年的GDP数据可能不准。

这需要我们调整参数,让预测值更准。点击模型参数高级参数面板,调整以下几个参数:
其中,
  • 水平平滑系数用于平衡水平方向的波动,取值如果靠中,意味着平衡了较近和较远的观测值的影响;
  • 趋势平滑系数用于平衡趋势波动,值越小,趋势的波动越小;
  • 季节平滑系数用于平衡季节波动,取值越大,表明当期季节部分预测仅仅基于最近的观测值。


这三个系数取值范围是0-1,值越大,影响权重就越大。我们分别将这三个系数调整为0.4,0.5,0.9。再看一下调整后的预测效果。
可以看到,调整参数后的历史的预测值跟历史实际值更为接近,同时平均绝对误差减少为6.65%,置信区间也在合理范围内。所以,我们最终预测的2017年GDP为11.9万亿美元,可能的GDP范围在11.19万亿美元-12.71万亿美元之间,与官方公布的127238亿美元非常接近,预测为准确的。

*小结
时间序列预测,可以让我们透过历史数据,洞悉未来趋势。时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。看了此文,你是不是开始蠢蠢欲动,想用来预测一把明天的股票价格呢?



最近看过此主题的会员

HHH2023

13560327322

大白

davidzhang

warise

jhdland

zhongzhong0908

辰哥

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

渠道咨询电话:137-0120-6790

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号