r语言数据挖掘中的,“回归分析”是如何操作的?

author author     2022-09-13     329

关键词:

回归分析是对多个自变量(又称为预测变量)建立一个函数来预测因变量(又称为响应变量的值)。


例如,银行根据房屋贷款申请人的年龄、收入、开支、职业、负担人口,以及整体信用限额等因素,来评估申请人的房贷风险。


线性回归


线性回归是利用预测变量的一个线性组合函数,来预测响应变量的统计分析方法,该线性回归模型的形式如下:


y = c0 + c1x1 + c2x2 + …+ ckxk;


x1, x2,… xk为预测变量,y为对预测的响应变量。


下面将在澳大利亚消费者价格指数(CPI)的数据上使用函数lm做线性回归分析


该数据为2008年到2010年澳大利亚的季度消费者价格指数。


1、需要创建数据集并绘制散布图。在下面的代码中,使用函数axis手动添加一个横坐标,参数las=3设置文字为垂直方向。


year <- rep(2008:2010, each=4)

quarter <- rep(1:4, 3)

cpi <- c(162.2, 164.6, 166.5, 166.0,

166.2, 167.0, 168.6, 169.5,

171.0, 172.1, 173.3, 174.0)

plot(cpi, xaxt="n", ylab="CPI", xlab="")

# draw x-axis

axis(1, labels=paste(year,quarter,sep="Q"), at=1:12, las=3)


澳大利亚2008-2010季度消费者价格指数

技术分享


2、查看CPI与其他变量之间的相关系数,包括year(年份)和quarter(季度)这两个变量

cor(year,cpi)

cor(quarter,cpi)


3、在前面的数据上使用函数lm建立一个线性回归模型,其中year和quarter为预测变量,CPI为响应变量。


fit <- lm(cpi ~ year + quarter)

fit


根据上面建立的线性模型,CPI的计算公式为:


cpi = c0 + c1 * year + c2 * quarter

其中,c0, c1, c2为拟合模型fit的系数。因此,2011年的CPI值可以计算如下。


(cpi2011 <- fit$coefficients[[1]] + fit$coefficients[[2]]*2011 + fit$coefficients[[3]]*(1:4))


该模型的更多细节可以通过下面的代码获得。


attributes(fit)

fit$coefficients


观测值与拟合结果的残差使用函数residuals 来计算。


residuals(fit)

summary(fit)


线性回归模型的预测图


下面的代码绘制拟合模型的图像,如图所示

plot(fit)


技术分享


拟合模型的3D图像


还可以绘制拟合模型的3D图像,下面代码中使用函数scatterplot3d创建一个3D


library(scatterplot3d)

s3d <- scatterplot3d(year, quarter, cpi, highlight.3d=T, type="h", lab=c(2,3))

s3d$plane3d(fit)


技术分享


拟合模型


基于拟合模型,20l1年的CPI可以通过如下方式预测,在后图中预测值用小三角表示。


data2011 <- data.frame(year=2011, quarter=1:4)

cpi2011 <- predict(fit, newdata=data2011)

style <- c(rep(1,12), rep(2,4))

plot(c(cpi, cpi2011), xaxt="n", ylab="CPI", xlab="", pch=style, col=style)

axis(1, at=1:16, las=3,

labels=c(paste(year,quarter,sep="Q"), "2011Q1", "2011Q2", "2011Q3", "2011Q4"))


基于线性回归模型得到的2011年CPI的预测值


技术分享


本文出自 “中科院计算所培训” 博客,谢绝转载!

r语言基础知识学习:r中的线性回归分析

在R中线性回归分析的函数是lm()。(1)一元线性回归我们可以根据以上数据来分析合金的强度是否与碳含量有关系。首用以下命令把数据读取到R中:x<-c(seq(0.10,0.18,by=0.01),0.20,0.21,0.23)y<-c(42.0,43.5,45.0,45.5,45.0,47.5,49.0,53.0,50.0,55.0,... 查看详情

看r语言建立回归分析,如何利用vif查看共线性问题

方法/步骤1、首先,先教大家如何使用SPSS多元线性回归分析2、接下来是范例说明:此案例是希望找到与营收相关的多元回归式原先加入参数有:5个调整後回归R方:0.888/显着性:皆小於0.05看起来相当拟合,无任何差错3、可依个... 查看详情

回归分析r语言--多元线性回归

参考技术A多元线性回归是简单线性回归的扩展,用于基于多个不同的预测变量(x)预测结果变量(y)。例如,对于三个预测变量(x),y​​的预测由以下等式表示:y=b0+b1*x1+b2*x2+b3*x3回归贝塔系数测量每个预测变量与结... 查看详情

如何在r语言中使用logistic回归模型

Logistic回归在做风险评估时,一般采用二值逻辑斯蒂回归(BinaryLogisticRegression)。以滑坡灾害风险评估为例。1、滑坡发生与否分别用0和1表示(1表示风险发生,0表示风险未发生);2、确定影响滑坡风险的影响因子,这个根据区... 查看详情

使用 R 中的回归分析进行时间序列预测

】使用R中的回归分析进行时间序列预测【英文标题】:TimeseriesforecastingusingRegressionAnalysisinR【发布时间】:2017-10-2514:51:04【问题描述】:作为我工作的一部分,我需要使用R评估时间序列数据上的不同预测模型,并选择误差最低... 查看详情

r语言中的theil-sen回归分析

原文链接:http://tecdat.cn/?p=10080  Theil-Sen估计器是一种在社会科学中不常用的简单线性回归估计器 。三个步骤:在数据中所有点之间绘制一条线计算每条线的斜率中位数斜率是回归斜率用这种方法计算斜率非常可靠。... 查看详情

r语言学习笔记1

数据分析1.探索性数据分析  数据分析中的必要步骤,通过作图了解数据。 2.统计推断  基于数据得出正式结论(错误概率≤5%)的过程    —不确定性(噪音数据)  结论+结论是错误的概率3.回归分析  线性... 查看详情

r语言对二分连续变量进行逻辑回归数据分析(代码片段)

原文链接:http://tecdat.cn/?p=10067教育或医学的标准情况是我们有一项连续的措施,但随后我们对那些具有临床/实践意义的措施有了切入点。一个例子是BMI。您可能有一个成绩测试,合格分数为70。研究人员有时可能会对30岁以上的... 查看详情

【r语言入门与数据分析-5】数据分析实战

参考技术A老师的吐槽大会,乐死我了。hhhregression,通常指用一个或者多个预测变量,也称自变量或者解释变量,来预测响应变量,也称为因变量、效标变量或者结果变量的方法存在多个变量AIC考虑模型统计拟合度、用来拟合的... 查看详情

拓端tecdat|r语言代码编写相关分析和稳健线性回归分析

R语言相关分析和稳健线性回归分析目录​​怎么做测试​​​​功率分析​​介绍下面以物种多样性为例子展示了如何在R语言中进行相关分析和线性回归分析。 怎么做测试相关和线性回归示例 Data=read.table(textConnection(Inp... 查看详情

r语言之线性回归分析

一、建立简单线性回归模型可使用函数lm实现,函数是围绕公式展开的,lm接受一个公式对象作为试图建立的模型,可以通过?formula来查询通用格式,data.frame也可以被明确指定,它包括所需的数据>library(RSADBE)>data(IO_Time)>IO_l... 查看详情

r语言生存分析cox回归分析实战:以乳腺癌数据为例

R语言生存分析COX回归分析实战:以乳腺癌数据为例目录 查看详情

r语言使用回归方法解决方差分析问题

R语言使用回归方法解决方差分析问题线性回归与t检验等价;线性回归与方差分析等价;线性回归与协方差分析等价;ANOVA和回归都是广义线性模型的特例。案例1回归分析做ANOVAlibrary(multcomp)levels(cholesterol$trt)fit.aov<-aov(response~trt... 查看详情

基于r语言实现lasso回归分析

主要步骤:将数据存成csv格式,逗号分隔在R中,读取数据,然后将数据转成矩阵形式加载lars包,先安装调用lars函数确定Cp值最小的步数确定筛选出的变量,并计算回归系数具体代码如下:需要注意的... 查看详情

如何区分回归分析中的分类变量和有序变量?

】如何区分回归分析中的分类变量和有序变量?【英文标题】:Howtodifferentiatecategoricalandordinalvariablesinregressionanalysis?【发布时间】:2016-03-1204:19:51【问题描述】:我正在对与房屋有关的数据进行线性回归分析。目前我有23个功能... 查看详情

r语言生存分析生成仿真数据构建cox回归分析模型并计算c-index

R语言生存分析生成仿真数据构建COX回归分析模型并计算C-index参考:R语言实战参考:R语言统计入门参考:R语言机器学习参考:从零开始学R语言,带你玩转医学统计学 查看详情

r语言实战回归

本文对应《R语言实战》第8章:回归回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。通常,回归分析可以用来挑选与相应变量相... 查看详情

r语言之logistic回归分析

一、probit回归模型在R中,可以使用glm函数(广义线性模型)实现,只需将选项binomial选项设为probit即可,并使用summary函数得到glm结果的细节,但是和lm不同,summary对于广义线性模型并不能给出决定系数,需要使用pscl包中的pR2函数... 查看详情