回归分析regress函数的应用

7152
2

xuxp 初学数据Lv2

发表于2019-11-24 14:48

楼主
1、函数简介:

1)函数说明

函数regress是用来做回归分析的,该函数包含三个参数,参数含义说明如下(参数按照其在函数的参数列表中顺序依次说明):
参数名称
参数取值说明
目标指标历史观测值
一维double数组Y;在Logistic回归分析模型中,Y的取值只能是0或者1;
影响因素历史观测值
二维double数组X;X的第一维长度跟Y相等,X的第二维长度应该都相等,并且等于影响因素的个数;
回归分析的模型名称(可选参数)
字符串;'LINEAR'表示采用线性回归模型进行分析,'LNLIN'表示采用对数线性回归模型进行分析, 'LOGIST'表示采用Logistic回归模型进行分析,
'NONLIN'表示采用非线性回归模型进行分析,'SVM'表示采用支持向量机回归模型进行分析;当这个参数省略时表示用线性回归模型进行分析

注:参数Y和X数组中都可以包含缺失值,无需进行特殊处理即可分析;另外regress函数的返回值是一个对象,利用该对象可以获取回归方程以及历史数据相关的信息,对该对象的描述见下一小节。

2)regress函数结果对象描述
属性或成员函数名称
含义说明
double error
属性;该属性表示回归模型的误差,在线性回归和非线性回归模型中,error表示历史目标指标预测的评价误差,
在Logistic回归模型中表示历史数据中目标指标预测错误的比例
int factorN
属性;该属性表示历史数据中影响因素的数目
double predict(X)
预测函数;该函数可以根据用户提供的影响因素X对目标指标进行预测,X为一维double型数组,长度为factorN,
当factorN为1时,X也可以为一个数,X可以包含缺失值
double[] predictInterval(X, prob)
区间预测函数(仅对第三个参数为"linear"的regress函数有用); 该函数根据用户提供的影响因素X对目标指标的区间预测, X为一维double型数组,长度为factorN, prob表示预测区间的置信度, 范围在0到1之间, 通常为0.9或者0.95
double[] historyPredicts
属性;该属性表示对用户提供的历史数据的目标指标的理论预测值
double[] Coeficients
属(仅对第三个参数为"linear"的regress函数有用);该属性表示线性回归和Logistic回归模型的回归方程系数,Coeficients[0]表示常数项,Coeficients为系数I的值
doulbe[] std
属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的标准差, std表示系数Coeficients的标准差
double[] t
属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的t统计量, t表示系数Coeficients的t统计量
double[] pvalue
属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的p值, pvalue表示系数Coeficients的p值
double[] ci(i, prob)
置信区间函数(仅对第三个参数为"linear"的regress函数有用); 该函数计算系数i的概率为prob的执行区间, 返回一个包含置信区间两个端点的数值数组
double RSQUARED决定系数、判定系数、拟合优度(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持)
double SSR每个提供的实际因变量(Y)与它们的预测值之差的平方和(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持)
double SST每个提供的实际因变量(Y)与它们的平均值之差的平方和(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持)
int NON_NAN_OBS_NUMB
合法观测值(Y)的个数,一般的,输入数值全部为合法数值时,NON_NAN_OBS_NUMB=Y.size(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持)

注:
SST – Sum of Squared Total
SSR – Sum of Squared Regression
SSE – Sum of Squared Error
SST=SSR+SSE
R^2=SSE/SST=1-SSR/SST

3)应用案例
      a、在报表中添加全局对象,如图1。
      b、在全局对象中,添加对象名和对象定义。其中对象名为报表模板中引用的对象名。对象定义,根据实际需求进行引用,如图2.
      c、在报表中应用reg.Coeficients即可得到[-20954.1190053,516926.5892296]。得到的回归方程即为:Y=-20954.1190053+516926.5892296*X





图1

图1

图2

图2

最近看过此主题的会员

youya1888

xugj831

数据大白

lingzed

2个回答

只看楼主

小亿 管理员

发表于2019-12-5 11:03

只看该作者

取消 关注该作者的回复

沙发

感谢分享,先替薏米们谢谢大神啦!

xxxl 数据领袖Lv6

发表于2021-3-18 17:41

只看该作者

取消 关注该作者的回复

板凳

abi522版本使用regress有bug
截图202103181741219907.png
需要补丁ABI-10861
补丁详情参考帖子最佳答案https://bbs.esensoft.com/thread-137370-1-1.html

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

渠道咨询电话:137-0120-6790

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号