r语言之线性回归分析

author author     2022-08-24     627

关键词:

一、建立简单线性回归模型
可使用函数lm实现,函数是围绕公式展开的,lm接受一个公式对象作为试图建立的模型,可以通过?formula来查询通用格式,data.frame也可以被明确指定,它包括所需的数据
> library(RSADBE)
> data(IO_Time)
> IO_lm = lm(CPU_Time ~ No_of_IO,data=IO_Time)
> class(IO_lm)
> summary(IO_lm)
结果中:
F-statistic: 635.4 on 1 and 8 DF,  p-value: 6.569e-09为模型的整体检验,也就是F检验

Multiple R-squared:  0.9876,    Adjusted R-squared:  0.986 为决定系数和校正的决定系数

            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 0.050933   0.010033   5.077 0.000957 ***
No_of_IO    0.040758   0.001617  25.207 6.57e-09 ***
为自变量和截距的估计值和检验结果,*越多表示越显著

Residuals:
      Min        1Q    Median        3Q       Max
-0.016509 -0.011592 -0.001327  0.005279  0.024006

为残差的统计量,中位数接近0表示接近标准正态分布,因为标准正态分的中位数为0

二、多元线性回归

也使用lm函数,但是公式格式有所改变

> data(Gasoline)
> gasoline_lm = lm(y~., data=Gasoline)
> summary(gasoline_lm)

这里公式y~.表示因变量为y,其余所有变量都为自变量

三、四种残差
1.标准化残差
就是将残差进行标准化后的结果

2.半学生化残差
对标准化残差的修正

3.预测残差
是真实值与预测值之差

4.R-学生化残差
对异常值的检测很有用

通过resid函数提取残差,并进行标准化,就得到标准化残差;
通过rstandard函数得到预测残差
通过rstudetn函数得到R-学生化残差

五、异常值

异常值分为杠杆点和影响点,针对自变量的称为杠杆点,针对因变量的称为影响点
1.杠杆点
杠杆点对回归系数没有影响,但是会影响决定系数,可以通过观察帽子矩阵来识别,杠杆作用的平均值为h=p/n,p为自变量个数,n为样本量,如果一个观测值的杠杆值>2h,则应考虑为杠杆点,考虑剔除或采取措施。R中可以通过hatvalues函数计算杠杆值。
> data(Gasoline)
> gasoline_lm = lm(y~., data=Gasoline)
> hatvalues(gasoline_lm)
> which(hatvalues(gasoline_lm) > length(gasoline_lm$coefficients)/nrow(Gasoline))

2.影响点
影响点有将回归线拉向它的趋势,因此会影响回归系数的值,可以通过COOK距离来判断,R中可以通过cooks.distance函数计算每个观测值的COOK距离。根据经验,如果距离大于1,则说明观测点为影响点。

此外,还可以通过dffits函数和dfbetas函数计算相应的值,如果dffits>2/根号p/n,那么可认为是影响点,如果dfbetas>2/根号n,也可认为是影响点,p为自变量个数,n为样本量

六、多重共线性
多重共线性可能会引起的问题有
1、回归系数不可信,并且可能符号出现错误
2.t检验和F检验失效
3.某些预测值的重要性会削弱
可以通过car包和faraway包的VIF函数计算VIF值

七、模型选择
函数step可以实现基于AIC准则的模型选择,最优模型为AIC值最小的
> data(Gasoline)
> gasoline_lm = lm(y~., data=Gasoline)
> step(gasoline_lm)

拓端tecdat|r语言代码编写相关分析和稳健线性回归分析

R语言相关分析和稳健线性回归分析目录​​怎么做测试​​​​功率分析​​介绍下面以物种多样性为例子展示了如何在R语言中进行相关分析和线性回归分析。 怎么做测试相关和线性回归示例 Data=read.table(textConnection(Inp... 查看详情

r语言pca主成分分析(principlecomponentanalysis)与线性回归结合实战

R语言PCA主成分分析(PrincipleComponentAnalysis)与线性回归结合实战 目录R语言PCA主成分分析(PrincipleComponentAnalysis)与线性回归结合实战 查看详情

r语言构建多元线性回归模型

R语言构建多元线性回归模型对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法。多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数学模型... 查看详情

r语言使用回归方法解决方差分析问题

R语言使用回归方法解决方差分析问题线性回归与t检验等价;线性回归与方差分析等价;线性回归与协方差分析等价;ANOVA和回归都是广义线性模型的特例。案例1回归分析做ANOVAlibrary(multcomp)levels(cholesterol$trt)fit.aov<-aov(response~trt... 查看详情

r语言回归分析(regression)常见算法:简单线性回归多项式回归多元线性回归多水平回归多输出回归逻辑回归泊松回归cox比例风险回归时间序列分析非线性回归非参数回归稳健回归等

R语言回归分析(regression)常见算法:简单线性回归、多项式回归、多元线性回归、多水平回归、多输出回归、逻辑回归、泊松回归、cox比例风险回归、时间序列分析、非线性回归、非参数回归、稳健回归等目录开发者涨薪指南4... 查看详情

r语言基础知识学习:r中的线性回归分析

在R中线性回归分析的函数是lm()。(1)一元线性回归我们可以根据以上数据来分析合金的强度是否与碳含量有关系。首用以下命令把数据读取到R中:x<-c(seq(0.10,0.18,by=0.01),0.20,0.21,0.23)y<-c(42.0,43.5,45.0,45.5,45.0,47.5,49.0,53.0,50.0,55.0,... 查看详情

如何用r语言做线性相关回归分析

...系数,还可以用scatterplotMatrix()函数生成散点图矩阵不过R语言没有直接给出偏相关的函数;我们要是做的话,要先调用cor.test()对变量进行Pearson相关性分析,得到简单相关系数,然后做t检验,判断显著性。参考技术A可以直接用cor... 查看详情

r语言广义线性模型logistic回归模型列线图分析(nomogram)

R语言广义线性模型Logistic回归模型列线图分析(nomogram)我们来看图说话:gist是一种胃肠道间质瘤,作者构建了无复发生存率的logistic回归模型。并构建了如下的列线图或者nomogram现在假设新来了以为患者:我们知道的信息如下... 查看详情

r语言广义线性模型logistic回归模型亚组分析及森林图绘制

R语言广义线性模型Logistic回归模型亚组分析及森林图绘制#Logistic回归案例6亚组分析森林图library(forestplot)rs_forest<-read.csv(\'rs_forest.csv\',header=FALSE)#读入数据的时候大家一定要把header设置成FALSE,保证第一行不被当作列名称。#tiff(\... 查看详情

r语言使用lmperm包应用于线性模型的置换方法(置换检验permutationtests)使用lm模型构建简单线性回归模型使用lmp函数生成置换检验回归分析模型

R语言使用lmPerm包应用于线性模型的置换方法(置换检验、permutationtests)、使用lm模型构建简单线性回归模型、使用lmp函数生成置换检验回归分析模型(Permutationtestsforsimplelinearregression)目录 查看详情

看r语言建立回归分析,如何利用vif查看共线性问题

方法/步骤1、首先,先教大家如何使用SPSS多元线性回归分析2、接下来是范例说明:此案例是希望找到与营收相关的多元回归式原先加入参数有:5个调整後回归R方:0.888/显着性:皆小於0.05看起来相当拟合,无任何差错3、可依个... 查看详情

r语言数据挖掘中的,“回归分析”是如何操作的?

回归分析是对多个自变量(又称为预测变量)建立一个函数来预测因变量(又称为响应变量的值)。例如,银行根据房屋贷款申请人的年龄、收入、开支、职业、负担人口,以及整体信用限额等因素,来评估申请人的房贷风险。线性... 查看详情

回归分析r语言--多元线性回归

参考技术A多元线性回归是简单线性回归的扩展,用于基于多个不同的预测变量(x)预测结果变量(y)。例如,对于三个预测变量(x),y​​的预测由以下等式表示:y=b0+b1*x1+b2*x2+b3*x3回归贝塔系数测量每个预测变量与结... 查看详情

r语言线性回归(代码片段)

回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型。这些变量之一称为预测变量,其值通过实验收集。另一个变量称为响应变量,其值来自预测变量。在线性回归中,这两个变量通过一个等式相关联,其中... 查看详情

r语言回归模型构建回归模型基本假设(正态性线性独立性方差齐性)回归模型诊断car包诊断回归模型特殊观察样本分析数据变换模型比较特征筛选交叉验证预测变量相对重要度

R语言回归模型构建、回归模型基本假设(正态性、线性、独立性、方差齐性)、回归模型诊断、car包诊断回归模型、特殊观察样本分析、数据变换、模型比较、特征筛选、交叉验证、预测变量相对重要度目录 查看详情

r语言做一元线性回归

只有两个变量,做相关性分析,先来个一元线性回归吧因为未处理的x,y相关性不显著,于是用了ln(1+x)函数做了个处理(发现大家喜欢用ln,log,lg,指数函数做处理),处理完以后貌似就显著了。。虽然R方也比较小model<-lm(y1~1+x1)sum... 查看详情

r语言之岭回归

岭回归可以用来解决过度拟合的问题一、线性模型的岭回归可使用ridge包中的linearRidge函数和MASS包中的lm.ridge函数>library(RSADBE)>data(OF)>LM<-lm.ridge(Y~poly(X,3),data=as.data.frame(OF),lambda=c(0,0.5,1,1.5,2,5,10,30))lambda为指定值二、Lo 查看详情

机器学习--线性回归r语言(代码片段)

回归分析就是利用样本,产生拟合方程,从而进行预测。简而言之,就是你用你手头上的数据进行模型的训练,然后用你得到的模型对于新数据进行预测。一元线性回归:例子:y<-c(61,57,58,40,90,35,68)#weight... 查看详情