簡體   English   中英

邏輯回歸

[英]R logistic regression

我是統計學和R的新手。 在我的數據集中,目標變量是航班狀態,以預測航班是否會延遲或准時起飛。 因此,它具有兩個響應變量值-Delayed和on-time。 因此,為了使用R構造邏輯回歸模型,我們是否必須首先將目標變量重新編碼為0和1? 我的意思是,它的延遲時間必須為0,延遲時間為1。 還是可以將目標變量作為因子?

請原諒我的基本問題。

data(iris)

Binary dependent variable:
iris$Species_binary <- ifelse(iris$Species=="setosa", "no", "yes")

它是否起作用?

glm(as.factor(iris$Species_binary)~iris$Sepal.Length, family="binomial")

是的,它確實。

 Call: glm(formula = as.factor(iris$Species_binary) ~ iris$Sepal.Length, family = "binomial") Coefficients: (Intercept) iris$Sepal.Length -27.829 5.176 Degrees of Freedom: 149 Total (ie Null); 148 Residual Null Deviance: 191 Residual Deviance: 71.84 AIC: 75.84 

它可以用作邏輯(布爾)變量嗎?

glm(I(iris$Species_binary=="yes")~iris$Sepal.Length, family="binomial")
 Call: glm(formula = I(iris$Species_binary == "yes") ~ iris$Sepal.Length, family = "binomial") Coefficients: (Intercept) iris$Sepal.Length -27.829 5.176 Degrees of Freedom: 149 Total (ie Null); 148 Residual Null Deviance: 191 Residual Deviance: 71.84 AIC: 75.84 

是的,會的。 當然,數值變量也可以。

大多數其他用於logit的軟件包/功能也是如此,但是某些行為可能會有所不同。 請注意,邏輯鏈接是二項式族的默認鏈接,這就是為什么我不必指定它的原因。

但是,如果這樣做,請確保您知道該因素的哪個水平被視為正水平! 否則,您對結果的解釋將是落后的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM