繁体   English   中英

逻辑回归

[英]R logistic regression

我是统计学和R的新手。 在我的数据集中,目标变量是航班状态,以预测航班是否会延迟或准时起飞。 因此,它具有两个响应变量值-Delayed和on-time。 因此,为了使用R构造逻辑回归模型,我们是否必须首先将目标变量重新编码为0和1? 我的意思是,它的延迟时间必须为0,延迟时间为1。 还是可以将目标变量作为因子?

请原谅我的基本问题。

data(iris)

Binary dependent variable:
iris$Species_binary <- ifelse(iris$Species=="setosa", "no", "yes")

它是否起作用?

glm(as.factor(iris$Species_binary)~iris$Sepal.Length, family="binomial")

是的,它确实。

 Call: glm(formula = as.factor(iris$Species_binary) ~ iris$Sepal.Length, family = "binomial") Coefficients: (Intercept) iris$Sepal.Length -27.829 5.176 Degrees of Freedom: 149 Total (ie Null); 148 Residual Null Deviance: 191 Residual Deviance: 71.84 AIC: 75.84 

它可以用作逻辑(布尔)变量吗?

glm(I(iris$Species_binary=="yes")~iris$Sepal.Length, family="binomial")
 Call: glm(formula = I(iris$Species_binary == "yes") ~ iris$Sepal.Length, family = "binomial") Coefficients: (Intercept) iris$Sepal.Length -27.829 5.176 Degrees of Freedom: 149 Total (ie Null); 148 Residual Null Deviance: 191 Residual Deviance: 71.84 AIC: 75.84 

是的,会的。 当然,数值变量也可以。

大多数其他用于logit的软件包/功能也是如此,但是某些行为可能会有所不同。 请注意,逻辑链接是二项式族的默认链接,这就是为什么我不必指定它的原因。

但是,如果这样做,请确保您知道该因素的哪个水平被视为正水平! 否则,您对结果的解释将是落后的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM