[英]R logistic regression
我是统计学和R的新手。 在我的数据集中,目标变量是航班状态,以预测航班是否会延迟或准时起飞。 因此,它具有两个响应变量值-Delayed和on-time。 因此,为了使用R构造逻辑回归模型,我们是否必须首先将目标变量重新编码为0和1? 我的意思是,它的延迟时间必须为0,延迟时间为1。 还是可以将目标变量作为因子?
请原谅我的基本问题。
data(iris)
Binary dependent variable:
iris$Species_binary <- ifelse(iris$Species=="setosa", "no", "yes")
它是否起作用?
glm(as.factor(iris$Species_binary)~iris$Sepal.Length, family="binomial")
是的,它确实。
Call: glm(formula = as.factor(iris$Species_binary) ~ iris$Sepal.Length, family = "binomial") Coefficients: (Intercept) iris$Sepal.Length -27.829 5.176 Degrees of Freedom: 149 Total (ie Null); 148 Residual Null Deviance: 191 Residual Deviance: 71.84 AIC: 75.84
它可以用作逻辑(布尔)变量吗?
glm(I(iris$Species_binary=="yes")~iris$Sepal.Length, family="binomial")
Call: glm(formula = I(iris$Species_binary == "yes") ~ iris$Sepal.Length, family = "binomial") Coefficients: (Intercept) iris$Sepal.Length -27.829 5.176 Degrees of Freedom: 149 Total (ie Null); 148 Residual Null Deviance: 191 Residual Deviance: 71.84 AIC: 75.84
是的,会的。 当然,数值变量也可以。
大多数其他用于logit的软件包/功能也是如此,但是某些行为可能会有所不同。 请注意,逻辑链接是二项式族的默认链接,这就是为什么我不必指定它的原因。
但是,如果这样做,请确保您知道该因素的哪个水平被视为正水平! 否则,您对结果的解释将是落后的。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.