繁体   English   中英

如何解释R归纳的线性回归系数?

[英]How to interpret the linear regression coefficient summarized by R?

请在下面找到reprex:

library(tidyverse)

# Work days for January from 2010 - 2018
data = data.frame(work_days = c(20,21,22,20,20,22,21,21),
           sale = c(1205,2111,2452,2054,2440,1212,1211,2111))

# Apply linear regression
model = lm(sale ~ work_days, data)

summary(model)
Call:
lm(formula = sale ~ work_days, data = data)

Residuals:
   Min     1Q Median     3Q    Max 
-677.8 -604.5  218.7  339.0  645.3 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  2643.82    5614.16   0.471    0.654
work_days     -38.05     268.75  -0.142    0.892

Residual standard error: 593.4 on 6 degrees of freedom
Multiple R-squared:  0.00333,   Adjusted R-squared:  -0.1628 
F-statistic: 0.02005 on 1 and 6 DF,  p-value: 0.892

您能否帮助我了解每个工作日的系数是否使销售额减少38.05


data = data.frame(work_days = c(20,21,22,20,20,22,21,21),
           sale = c(1212,1211,2111,1205,2111,2452,2054,2440))

model = lm(sale ~ work_days, data)

summary(model)
Call:
lm(formula = sale ~ work_days, data = data)

Residuals:
   Min     1Q Median     3Q    Max 
-686.8 -301.0   -8.6  261.3  599.7 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  -6220.0     4555.9  -1.365    0.221
work_days      386.6      218.1   1.772    0.127

Residual standard error: 481.5 on 6 degrees of freedom
Multiple R-squared:  0.3437,    Adjusted R-squared:  0.2343 
F-statistic: 3.142 on 1 and 6 DF,  p-value: 0.1267

意思是不是,

每个工作日使销售额增加387? 负截距怎么样?

类似的问题,但不能应用这些知识:

解释R中的回归系数

从R的Logistic回归解释系数

R中回归系数的线性组合

您能否帮助我了解每个工作日的系数是否使销售额减少38.05

是的,没有。 仅给出8个数据点,最佳回归线的负斜率为-38.05,这似乎违反直觉。

但是,您需要考虑此-38.05值的标准误差,即268.75。 因此,结果可以转换为“在此示例中,斜率看起来为负,但也可能为正,'-38.05 + 2 * 268.75'和'-38.05-2 * 268.75'之间的任何值都是合理的猜测。因此,请勿将这个小样本外推到该样本以外的任何其他内容。

还看

Multiple R-squared:  0.00333

这意味着用该回归可以解释少于1%的样本方差。 不要认真对待它,并尝试解释这么小的样本中的数字。

每个工作日使销售额增加387? 负截距怎么样?

仅从您调查的小样本来看,每个工作日的销售额看起来增加了387。但是,标准误很高,因此您无法确定额外工作日是增加还是减少了该小样本的销售额。 整个模型并不重要,因此没有人声称,该模型比纯猜测更好。

负截距怎么样?

您强迫计算机计算线性模型。 该模型将允许您计算愚蠢的值,例如“如果销售是工作日的线性函数,而一个月的工作日为负或零,该怎么办?” 您当然可以强迫R预测线性模型,其中零工作日导致零销售,这使我们重新回到主题上。 强制R通过点(0; 0)计算模型采用以下语法:

model <- lm(sales ~ work_days - 1, data = data)

回归线的截距被解释为预测salework_days等于zero 如果预测变量(在这种情况下为work_days )不能为零,则没有意义。 回归线的斜率或预测的估计值-38.5可解释为work_days每增加work_days ,销售量减少-38.05

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM