-
xuxp 初学数据Lv2
发表于2019-11-24 14:48
楼主
1、函数简介:
1)函数说明
函数regress是用来做回归分析的,该函数包含三个参数,参数含义说明如下(参数按照其在函数的参数列表中顺序依次说明):
2)regress函数结果对象描述
1)函数说明
函数regress是用来做回归分析的,该函数包含三个参数,参数含义说明如下(参数按照其在函数的参数列表中顺序依次说明):
参数名称 | 参数取值说明 |
目标指标历史观测值 | 一维double数组Y;在Logistic回归分析模型中,Y的取值只能是0或者1; |
影响因素历史观测值 | 二维double数组X;X的第一维长度跟Y相等,X的第二维长度应该都相等,并且等于影响因素的个数; |
回归分析的模型名称(可选参数) | 字符串;'LINEAR'表示采用线性回归模型进行分析,'LNLIN'表示采用对数线性回归模型进行分析, 'LOGIST'表示采用Logistic回归模型进行分析, 'NONLIN'表示采用非线性回归模型进行分析,'SVM'表示采用支持向量机回归模型进行分析;当这个参数省略时表示用线性回归模型进行分析 |
注:参数Y和X数组中都可以包含缺失值,无需进行特殊处理即可分析;另外regress函数的返回值是一个对象,利用该对象可以获取回归方程以及历史数据相关的信息,对该对象的描述见下一小节。
属性或成员函数名称 | 含义说明 |
double error | 属性;该属性表示回归模型的误差,在线性回归和非线性回归模型中,error表示历史目标指标预测的评价误差, 在Logistic回归模型中表示历史数据中目标指标预测错误的比例 |
int factorN | 属性;该属性表示历史数据中影响因素的数目 |
double predict(X) | 预测函数;该函数可以根据用户提供的影响因素X对目标指标进行预测,X为一维double型数组,长度为factorN, 当factorN为1时,X也可以为一个数,X可以包含缺失值 |
double[] predictInterval(X, prob) | 区间预测函数(仅对第三个参数为"linear"的regress函数有用); 该函数根据用户提供的影响因素X对目标指标的区间预测, X为一维double型数组,长度为factorN, prob表示预测区间的置信度, 范围在0到1之间, 通常为0.9或者0.95 |
double[] historyPredicts | 属性;该属性表示对用户提供的历史数据的目标指标的理论预测值 |
double[] Coeficients | 属(仅对第三个参数为"linear"的regress函数有用);该属性表示线性回归和Logistic回归模型的回归方程系数,Coeficients[0]表示常数项,Coeficients为系数I的值 |
doulbe[] std | 属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的标准差, std表示系数Coeficients的标准差 |
double[] t | 属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的t统计量, t表示系数Coeficients的t统计量 |
double[] pvalue | 属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的p值, pvalue表示系数Coeficients的p值 |
double[] ci(i, prob) | 置信区间函数(仅对第三个参数为"linear"的regress函数有用); 该函数计算系数i的概率为prob的执行区间, 返回一个包含置信区间两个端点的数值数组 |
double RSQUARED | 决定系数、判定系数、拟合优度(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持) |
double SSR | 每个提供的实际因变量(Y)与它们的预测值之差的平方和(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持) |
double SST | 每个提供的实际因变量(Y)与它们的平均值之差的平方和(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持) |
int NON_NAN_OBS_NUMB | 合法观测值(Y)的个数,一般的,输入数值全部为合法数值时,NON_NAN_OBS_NUMB=Y.size(bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持) |
注:
SST – Sum of Squared Total
SSR – Sum of Squared Regression
SSE – Sum of Squared Error
SST=SSR+SSE
R^2=SSE/SST=1-SSR/SST
3)应用案例
a、在报表中添加全局对象,如图1。
b、在全局对象中,添加对象名和对象定义。其中对象名为报表模板中引用的对象名。对象定义,根据实际需求进行引用,如图2.
c、在报表中应用reg.Coeficients即可得到[-20954.1190053,516926.5892296]。得到的回归方程即为:Y=-20954.1190053+516926.5892296*X