我的位置：首页 › 一站式数据分析平台-亿信ABI › 亿信ABI-心得体验 › 回归分析regress函数的应用

回归分析regress函数的应用

复制链接 | 收藏本帖

9168

2

: xuxp 初学数据Lv2

发表于2019-11-24 14:48

楼主

1、函数简介：

1）函数说明

函数regress是用来做回归分析的，该函数包含三个参数，参数含义说明如下（参数按照其在函数的参数列表中顺序依次说明）：

参数名称	参数取值说明
目标指标历史观测值	一维double数组Y；在Logistic回归分析模型中，Y的取值只能是0或者1；
影响因素历史观测值	二维double数组X；X的第一维长度跟Y相等，X的第二维长度应该都相等，并且等于影响因素的个数；
回归分析的模型名称(可选参数)	字符串；'LINEAR'表示采用线性回归模型进行分析,'LNLIN'表示采用对数线性回归模型进行分析, 'LOGIST'表示采用Logistic回归模型进行分析, 'NONLIN'表示采用非线性回归模型进行分析,'SVM'表示采用支持向量机回归模型进行分析；当这个参数省略时表示用线性回归模型进行分析

注：参数Y和X数组中都可以包含缺失值，无需进行特殊处理即可分析；另外regress函数的返回值是一个对象，利用该对象可以获取回归方程以及历史数据相关的信息，对该对象的描述见下一小节。

2）regress函数结果对象描述

属性或成员函数名称	含义说明
double error	属性；该属性表示回归模型的误差，在线性回归和非线性回归模型中，error表示历史目标指标预测的评价误差，在Logistic回归模型中表示历史数据中目标指标预测错误的比例
int factorN	属性；该属性表示历史数据中影响因素的数目
double predict(X)	预测函数；该函数可以根据用户提供的影响因素X对目标指标进行预测，X为一维double型数组，长度为factorN，当factorN为1时，X也可以为一个数，X可以包含缺失值
double[] predictInterval(X, prob)	区间预测函数(仅对第三个参数为"linear"的regress函数有用); 该函数根据用户提供的影响因素X对目标指标的区间预测, X为一维double型数组，长度为factorN, prob表示预测区间的置信度, 范围在0到1之间, 通常为0.9或者0.95
double[] historyPredicts	属性；该属性表示对用户提供的历史数据的目标指标的理论预测值
double[] Coeficients	属(仅对第三个参数为"linear"的regress函数有用)；该属性表示线性回归和Logistic回归模型的回归方程系数，Coeficients[0]表示常数项，Coeficients为系数I的值
doulbe[] std	属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的标准差, std表示系数Coeficients的标准差
double[] t	属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的t统计量, t表示系数Coeficients的t统计量
double[] pvalue	属性(仅对第三个参数为"linear"的regress函数有用); 该属性表示线性回归系数的p值, pvalue表示系数Coeficients的p值
double[] ci(i, prob)	置信区间函数(仅对第三个参数为"linear"的regress函数有用); 该函数计算系数i的概率为prob的执行区间, 返回一个包含置信区间两个端点的数值数组
double RSQUARED	决定系数、判定系数、拟合优度（bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持）
double SSR	每个提供的实际因变量(Y)与它们的预测值之差的平方和（bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持）
double SST	每个提供的实际因变量(Y)与它们的平均值之差的平方和（bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持）
int NON_NAN_OBS_NUMB	合法观测值(Y)的个数，一般的，输入数值全部为合法数值时，NON_NAN_OBS_NUMB=Y.size（bi4.5.2及util1.2.4 build-date >= 2017.10.11 17:09:00起支持）

注：

SST – Sum of Squared Total

SSR – Sum of Squared Regression

SSE – Sum of Squared Error

SST=SSR+SSE

R^2=SSE/SST=1-SSR/SST

3）应用案例

a、在报表中添加全局对象，如图1。

b、在全局对象中，添加对象名和对象定义。其中对象名为报表模板中引用的对象名。对象定义，根据实际需求进行引用，如图2.

c、在报表中应用reg.Coeficients即可得到[-20954.1190053,516926.5892296]。得到的回归方程即为：Y=-20954.1190053+516926.5892296*X

最近看过此主题的会员

QQ空间微信

2个回答

: 小亿管理员

发表于2019-12-5 11:03

丨

只看该作者

丨

取消关注该作者的回复

沙发

感谢分享，先替薏米们谢谢大神啦！

: xxxl 数据领袖Lv6

发表于2021-3-18 17:41

丨

只看该作者

丨

取消关注该作者的回复

板凳

abi522版本使用regress有bug

需要补丁ABI-10861
补丁详情参考帖子最佳答案https://bbs.esensoft.com/thread-137370-1-1.html

登录后可回答问题，请登录或注册

用产品，聊感受！

我要发帖

热门产品推荐

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品: 一站式数据分析平台-亿信ABI

智能数据治理平台-睿治

解决方案: 大数据治理方案

数据标准化及质量管控方案

主数据管理方案

数据资产盘点方案

联系合作

400咨询：400-0011-866

技术支持QQ：400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们: 扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司京ICP备07017321号京公网安备11010802016281号