r语言对回归模型进行协方差分析

tecdat tecdat     2023-05-03     494

关键词:

原文链接:http://tecdat.cn/?p=9529


 

目录

 

怎么做测试

协方差分析

拟合线的简单图解

模型的p值和R平方

检查模型的假设

具有三类和II型平方和的协方差示例分析

协方差分析

拟合线的简单图解

组合模型的p值和R平方

检查模型的假设


怎么做测试

具有两个类别和II型平方和的协方差示例的分析

本示例使用II型平方和 。参数估计值在R中的计算方式不同, 

 



Data = read.table(textConnection(Input),header=TRUE)
技术图片

 

 

 

plot(x   = Data$Temp, 
     y   = Data$Pulse, 
     col = Data$Species, 
     pch = 16,
     xlab = "Temperature",
     ylab = "Pulse")

legend(‘bottomright‘, 
       legend = levels(Data$Species), 
       col = 1:2, 
       cex = 1,    
       pch = 16)
技术图片

 

 

 

协方差分析

 



 

Anova Table (Type II tests)

 

             Sum Sq Df  F value    Pr(>F)   

Temp         4376.1  1 1388.839 < 2.2e-16 ***

Species       598.0  1  189.789 9.907e-14 ***

Temp:Species    4.3  1    1.357    0.2542    

 

### Interaction is not significant, so the slope across groups

### is not different. 

 

 

model.2 = lm (Pulse ~ Temp + Species,
              data = Data)

library(car)

Anova(model.2, type="II")

 

Anova Table (Type II tests)

 

          Sum Sq Df F value    Pr(>F)   

Temp      4376.1  1  1371.4 < 2.2e-16 ***

Species    598.0  1   187.4 6.272e-14 ***

 

### The category variable (Species) is significant,

### so the intercepts among groups are different

 

 

Coefficients:

             Estimate Std. Error t value Pr(>|t|)   

(Intercept)  -7.21091    2.55094  -2.827  0.00858 **

Temp          3.60275    0.09729  37.032  < 2e-16 ***

Speciesniv  -10.06529    0.73526 -13.689 6.27e-14 ***

 


###   but the calculated results will be identical.

### The slope estimate is the same.

### The intercept for species 1 (ex) is (intercept).

### The intercept for species 2 (niv) is (intercept) + Speciesniv.

### This is determined from the contrast coding of the Species

### variable shown below, and the fact that Speciesniv is shown in

### coefficient table above.

 

 

    niv

ex    0

niv   1
技术图片

 

 

拟合线的简单图解

 


plot(x   = Data$Temp, 
     y   = Data$Pulse, 
     col = Data$Species, 
     pch = 16,
     xlab = "Temperature",
     ylab = "Pulse")
技术图片

 技术图片技术图片?

模型的p值和R平方

 

 



Multiple R-squared:  0.9896,  Adjusted R-squared:  0.9888

F-statistic:  1331 on 2 and 28 DF,  p-value: < 2.2e-16
技术图片

 

 

检查模型的假设

 

 技术图片技术图片?

 

线性模型中残差的直方图。这些残差的分布应近似正态。

 

 

 

 技术图片技术图片?

残差与预测值的关系图。残差应无偏且均等。 

 

 

### additional model checking plots with: plot(model.2)
### alternative: library(FSA); residPlot(model.2) 
技术图片

 

具有三类和II型平方和的协方差示例分析

本示例使用II型平方和,并考虑具有三个组的情况。 

### --------------------------------------------------------------
### Analysis of covariance, hypothetical data
### --------------------------------------------------------------


Data = read.table(textConnection(Input),header=TRUE)
技术图片

 

 

 

 

plot(x   = Data$Temp, 
     y   = Data$Pulse, 
     col = Data$Species, 
     pch = 16,
     xlab = "Temperature",
     ylab = "Pulse")

legend(‘bottomright‘, 
       legend = levels(Data$Species), 
       col = 1:3, 
       cex = 1,    
       pch = 16)
技术图片

 

 

 

协方差分析

 

options(contrasts = c("contr.treatment", "contr.poly"))
   
   ### These are the default contrasts in R

 
Anova(model.1, type="II")

 

             Sum Sq Df   F value Pr(>F)   

Temp         7026.0  1 2452.4187 <2e-16 ***

Species      7835.7  2 1367.5377 <2e-16 ***

Temp:Species    5.2  2    0.9126 0.4093   

  

### Interaction is not significant, so the slope among groups

### is not different. 

 

 

 

Anova(model.2, type="II")

 

          Sum Sq Df F value    Pr(>F)   

Temp      7026.0  1  2462.2 < 2.2e-16 ***

Species   7835.7  2  1373.0 < 2.2e-16 ***

Residuals  125.6 44 

 

### The category variable (Species) is significant,

### so the intercepts among groups are different

 

 

summary(model.2)

 

Coefficients:

             Estimate Std. Error t value Pr(>|t|)   

(Intercept)  -6.35729    1.90713  -3.333  0.00175 **

Temp          3.56961    0.07194  49.621  < 2e-16 ***

Speciesfake  19.81429    0.66333  29.871  < 2e-16 ***

Speciesniv  -10.18571    0.66333 -15.355  < 2e-16 ***

 

### The slope estimate is the Temp coefficient.

### The intercept for species 1 (ex) is (intercept).

### The intercept for species 2 (fake) is (intercept) + Speciesfake.

### The intercept for species 3 (niv) is (intercept) + Speciesniv.

### This is determined from the contrast coding of the Species

### variable shown below.

 

 

contrasts(Data$Species)

 

     fake niv

ex      0   0

fake    1   0

niv     0   1
技术图片

 

拟合线的简单图解

 

 技术图片技术图片?

 

组合模型的p值和R平方

 

 


 

Multiple R-squared:  0.9919,  Adjusted R-squared:  0.9913

F-statistic:  1791 on 3 and 44 DF,  p-value: < 2.2e-16
技术图片

 

 

 

检查模型的假设

hist(residuals(model.2), 
     col="darkgray")
技术图片

 

 技术图片技术图片?

线性模型中残差的直方图。这些残差的分布应近似正态。

 

 

plot(fitted(model.2), 
     residuals(model.2))
技术图片

 技术图片技术图片?

 

残差与预测值的关系图。残差应无偏且均等。 

 

 

 

### additional model checking plots with: plot(model.2)
### alternative: library(FSA); residPlot(model.2) 

 
技术图片

 

如果您有任何疑问,请在下面发表评论。 

 

 

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

技术图片?技术图片QQ:3025393450

 

技术图片?QQ交流群:186388004 技术图片

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据爬虫采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询

技术图片

 

欢迎关注微信公众号,了解更多数据干货资讯!
 
技术图片技术图片
 

欢迎选修我们的R语言数据分析挖掘必知必会课程!

技术图片

r语言方差分析函数aov和回归模型函数lm的关系公式中使用的符号说明常见的方差分析研究设计公式(formulasforcommonresearchdesigns)因子顺序对分析的影响

R语言方差分析函数aov和回归模型函数lm的关系、formula公式中使用的符号说明、常见的方差分析研究设计公式(Formulasforcommonresearchdesigns)、因子顺序对分析的影响目录 查看详情

r语言使用回归方法解决方差分析问题

...归与t检验等价;线性回归与方差分析等价;线性回归与协方差分析等价;ANOVA和回归都是广义线性模型的特例。案例1回归分析做ANOVAlibrary(multcomp)levels(cholesterol$trt)fit.aov<-aov(response~trt,data=cholesterol)summary(fit.aov)fit.lm<-l 查看详情

r语言构建多元线性回归模型

R语言构建多元线性回归模型对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法。多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数学模型... 查看详情

r语言回归模型构建回归模型基本假设(正态性线性独立性方差齐性)回归模型诊断car包诊断回归模型特殊观察样本分析数据变换模型比较特征筛选交叉验证预测变量相对重要度

R语言回归模型构建、回归模型基本假设(正态性、线性、独立性、方差齐性)、回归模型诊断、car包诊断回归模型、特殊观察样本分析、数据变换、模型比较、特征筛选、交叉验证、预测变量相对重要度目录 查看详情

r语言如何确认限制性样条分析的最佳节点个数进行方差分析通过p值确认指定连续变量和风险值hr之间是否存在非线性关系限制性立方样条cox回归模型

R语言如何确认限制性样条分析的最佳节点个数、进行方差分析通过p值确认指定连续变量和风险值HR之间是否存在非线性关系、限制性立方样条cox回归模型目录 查看详情

【r语言入门与数据分析-5】数据分析实战

参考技术A老师的吐槽大会,乐死我了。hhhregression,通常指用一个或者多个预测变量,也称自变量或者解释变量,来预测响应变量,也称为因变量、效标变量或者结果变量的方法存在多个变量AIC考虑模型统计拟合度、用来拟合的... 查看详情

r语言使用cph函数和rcs函数构建限制性立方样条cox回归模型使用anova函数进行方差分析通过p值确认指定连续变量和风险值hr之间是否存在非线性关系

R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用anova函数进行方差分析通过p值确认指定连续变量和风险值HR之间是否存在非线性关系目录 查看详情

r语言构建回归模型并进行模型诊断diagnostics(正态性线性独立性方差齐性)如果模型构建的初始假设不满足常使用的补救措施(correctivemeasures)

R语言构建回归模型并进行模型诊断diagnostics(正态性、线性、独立性、方差齐性)、如果模型构建的初始假设不满足、常使用的补救措施(Corrective measures)目录 查看详情

r语言可视化回归模型的残差直方图并进行残差分析(histogramofresiduals)

R语言可视化回归模型的残差直方图并进行残差分析(HistogramofResiduals)目录R语言可视化回归模型的残差 查看详情

多因素方差分析与回归分析有啥异同啊?

...因素对因变量的影响显著性的时候,该选用方差分析还是回归分析啊?可以通用吗?1、分析对象不同回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。多因素方差分析,当有两个... 查看详情

一张成绩单怎么用r语言怎么输数据并对数据进行分析,比如求均值,中位数,方差分析回归分析

参考技术AidΜ五ⅶuq药皈dΜ五ⅶpaエбq药皈aエбaエб84466447312011-09-1219:08:42n┒唬Ф谩udg猢vcjタ┌twx┄容量指样本数,显然为7中位数是将样本从小到大排列,处于中间的那个样本(样本数为奇数)或处于中间的那两... 查看详情

r语言单因素方差分析与协方差分析

R语言单因素方差分析与协方差分析条件:各个样本是相互独立的随机;各个样本来自正态总体;具有方差齐性;用途:检验两个或多样本均数间的差异有无统计学意义;注:本均数的比较可以采用t检验或F检验,两个以上样本均... 查看详情

r语言glm拟合logistic回归模型实战:基于glm构建逻辑回归模型及模型系数统计显著性分析每个预测因子对响应变量的贡献

R语言glm拟合logistic回归模型实战:基于glm构建逻辑回归模型及模型系数统计显著性分析、每个预测因子对响应变量的贡献目录 查看详情

使用回归模型(LM,LMER)重复测量方差分析

】使用回归模型(LM,LMER)重复测量方差分析【英文标题】:repeatedmeasureanovausingregressionmodels(LM,LMER)【发布时间】:2013-02-1410:24:51【问题描述】:我想使用回归模型而不是“方差分析”(AOV)函数在R中运行重复测量方差分析。这是... 查看详情

相关性分析

...量之间线性相关的度量,分三种,spearman,pearson,kendall。*协方差:两个变量变化是同方向的还是异方向的。X高Y也高,协方差就是正,相反,则是负。*为什么要除标准差:标准化。即消除了X和Y自身变化的影响,只讨论两者之间关系... 查看详情

r语言双因素方差分析

R语言双因素方差分析条件:各个样本是相互独立的随机;各个样本来自正态总体;具有方差齐性;用途:检验两个或多样本均数间的差异有无统计学意义;注:本均数的比较可以采用t检验或F检验,两个以上样本均数的比较只能... 查看详情

r语言使用cox函数构建生存分析回归模型使用subgroupanalysis进行亚组分析并可视化森林图

R语言使用cox函数构建生存分析回归模型、使用subgroupAnalysis进行亚组分析并可视化森林图目录 查看详情

r语言使用cox函数构建生存分析回归模型使用subgroupanalysis进行亚组分析并可视化森林图

R语言使用cox函数构建生存分析回归模型、使用subgroupAnalysis进行亚组分析并可视化森林图目录 查看详情