r语言中的theil-sen回归分析

tecdat tecdat     2023-04-27     651

关键词:

原文链接:http://tecdat.cn/?p=10080


 

 Theil-Sen估计器是一种在社会科学中不常用 的简单线性回归估计器  。三个步骤:

  • 在数据中所有点之间绘制一条线
  • 计算每条线的斜率
  • 中位数斜率是 回归斜率

用这种方法计算斜率非常可靠。当误差呈正态分布且没有异常值时,斜率与OLS非常相似。 

有几种获取截距的方法。如果 关心回归中的截距,那么知道 软件在做什么是很合理的。 

当我对异常值和异方差性有担忧时,请在上方针对Theil-Sen进行简单线性回归的评论 。

我进行了一次 模拟,以了解Theil-Sen如何在异方差下与OLS比较。它是更有效的估计器。

library(simglm)
library(ggplot2)
library(dplyr)
library(WRS)

# Hetero
nRep <- 100
n.s <- c(seq(50, 300, 50), 400, 550, 750, 1000)
samp.dat <- sample((1:(nRep*length(n.s))), 25)
lm.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))
ts.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))
lmt.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))
dat.s <- list()



ggplot(dat.frms.0, aes(x = age, y = sim_data)) +
  geom_point(shape = 1, size = .5) +
  geom_smooth(method = "lm", se = FALSE) +
  facet_wrap(~ random.sample, nrow = 5) +
  labs(x = "Predictor", y = "Outcome",
       title = "Random sample of 25 datasets from 15000 datasets for simulation",
       subtitle = "Heteroscedastic relationships")


技术图片

技术图片技术图片?

 
ggplot(coefs.0, aes(x = n, colour = Estimator)) +
  geom_boxplot(
    aes(ymin = q025, lower = q25, middle = q50, upper = q75, ymax = q975), data = summarise(
      group_by(coefs.0, n, Estimator), q025 = quantile(Slope, .025),
      q25 = quantile(Slope, .25), q50 = quantile(Slope, .5),
      q75 = quantile(Slope, .75), q975 = quantile(Slope, .975)), stat = "identity") +
  geom_hline(yintercept = 2, linetype = 2) + scale_y_continuous(breaks = seq(1, 3, .05)) +
  labs(x = "Sample size", y = "Slope",
       title = "Estimation of regression slope in simple linear regression under heteroscedasticity",
       subtitle = "1500 replications - Population slope is 2",
       caption = paste(
         "Boxes are IQR, whiskers are middle 95% of slopes",
         "Both estimators are unbiased in the long run, however, OLS has higher variability",
         sep = "
"
       ))



技术图片

技术图片技术图片?

 

 

如果您有任何疑问,请在下面发表评论。 

 

 

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

技术图片?技术图片QQ:3025393450

 

技术图片?QQ交流群:186388004 技术图片

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据爬虫采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询

技术图片

 

欢迎关注微信公众号,了解更多数据干货资讯!
 
技术图片技术图片
 

欢迎选修我们的R语言数据分析挖掘必知必会课程!

技术图片

r语言数据挖掘中的,“回归分析”是如何操作的?

回归分析是对多个自变量(又称为预测变量)建立一个函数来预测因变量(又称为响应变量的值)。例如,银行根据房屋贷款申请人的年龄、收入、开支、职业、负担人口,以及整体信用限额等因素,来评估申请人的房贷风险。线性... 查看详情

r语言之logistic回归分析

一、probit回归模型在R中,可以使用glm函数(广义线性模型)实现,只需将选项binomial选项设为probit即可,并使用summary函数得到glm结果的细节,但是和lm不同,summary对于广义线性模型并不能给出决定系数,需要使用pscl包中的pR2函数... 查看详情

r语言回归模型协方差分析(analysisofcovariance)

R语言回归模型协方差分析(AnalysisofCovariance)目录R语言回归模型协方差分析(AnalysisofCovariance)输入数据ANCOVA分析 查看详情

回归分析r语言--多元线性回归

参考技术A多元线性回归是简单线性回归的扩展,用于基于多个不同的预测变量(x)预测结果变量(y)。例如,对于三个预测变量(x),y​​的预测由以下等式表示:y=b0+b1*x1+b2*x2+b3*x3回归贝塔系数测量每个预测变量与结... 查看详情

r语言使用回归方法解决方差分析问题

R语言使用回归方法解决方差分析问题线性回归与t检验等价;线性回归与方差分析等价;线性回归与协方差分析等价;ANOVA和回归都是广义线性模型的特例。案例1回归分析做ANOVAlibrary(multcomp)levels(cholesterol$trt)fit.aov<-aov(response~trt... 查看详情

r语言logistic回归模型亚组分析森林图(forestplot)绘制

R语言Logistic回归模型亚组分析森林图(forestplot)绘制目录R语言Logistic回归模型亚组分析森林图(forestplot)R语言Logistic回归模型亚组分析森林图 查看详情

拓端tecdat|r语言代码编写相关分析和稳健线性回归分析

R语言相关分析和稳健线性回归分析目录​​怎么做测试​​​​功率分析​​介绍下面以物种多样性为例子展示了如何在R语言中进行相关分析和线性回归分析。 怎么做测试相关和线性回归示例 Data=read.table(textConnection(Inp... 查看详情

r语言pca主成分分析(principlecomponentanalysis)与线性回归结合实战

R语言PCA主成分分析(PrincipleComponentAnalysis)与线性回归结合实战 目录R语言PCA主成分分析(PrincipleComponentAnalysis)与线性回归结合实战 查看详情

r语言生存分析cox回归分析实战:以乳腺癌数据为例

R语言生存分析COX回归分析实战:以乳腺癌数据为例目录 查看详情

r语言泊松回归模型案例:基于aer包的affair数据分析

R语言泊松回归模型案例:基于AER包的affair数据分析目录R语言泊松回归模型案例基于AER包的affair数据分析#数据加载 查看详情

r语言logistic回归模型案例:分析吸烟饮酒与食管癌的关系

R语言Logistic回归模型案例:分析吸烟、饮酒与食管癌的关系目录R语言Logistic回归模型案例分析吸烟、饮酒与食管癌的关系#样例数据 查看详情

r语言logistic逐步回归模型案例:分析与冠心病有关的危险因素

R语言Logistic逐步回归模型案例:分析与冠心病有关的危险因素目录R语言Logistic逐步回归模型案例:分析与冠心病有关的危险因素 查看详情

r语言可视化回归模型的残差直方图并进行残差分析(histogramofresiduals)

R语言可视化回归模型的残差直方图并进行残差分析(HistogramofResiduals)目录R语言可视化回归模型的残差 查看详情

r语言logistic回归模型案例基于aer包的affair数据分析

R语言Logistic回归模型案例基于AER包的affair数据目录R语言Logistic回归模型案例基于AER包的affair数据#数据加载及目标变量二值化 查看详情

r语言生存分析生成仿真数据构建cox回归分析模型并计算c-index

R语言生存分析生成仿真数据构建COX回归分析模型并计算C-index参考:R语言实战参考:R语言统计入门参考:R语言机器学习参考:从零开始学R语言,带你玩转医学统计学 查看详情

r语言构建多元线性回归模型

R语言构建多元线性回归模型对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法。多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数学模型... 查看详情

使用 R 中的回归分析进行时间序列预测

】使用R中的回归分析进行时间序列预测【英文标题】:TimeseriesforecastingusingRegressionAnalysisinR【发布时间】:2017-10-2514:51:04【问题描述】:作为我工作的一部分,我需要使用R评估时间序列数据上的不同预测模型,并选择误差最低... 查看详情

r语言logistic回归模型案例:低出生婴儿体重的影响因素分析(列线图校准曲线)

R语言Logistic回归模型案例:低出生婴儿体重影响因素分析(列线图、校准曲线)目录R语言Logistic回归模型案例:低出生婴儿体重影响因素分析(列线图、校准曲线ÿ 查看详情