簡體   English   中英

R中的逐步回歸誤差

[英]Stepwise regression error in R

我想在R中運行逐步回歸以選擇最佳擬合模型,我的代碼附在這里:

full.modelfixed <- glm(died_ed ~ age_1 + gender + race + insurance + injury + ais + blunt_pen + 
               comorbid + iss +min_dist + pop_dens_new + age_mdn + male_pct + 
               pop_wht_pct + pop_blk_pct + unemp_pct + pov_100x_npct +
               urban_pct, data = trauma, family = binomial (link = 'logit'), na.action = na.exclude)
reduced.modelfixed <- stepAIC(full.modelfixed, direction = "backward")

有錯誤消息說

Error in stepAIC(full.modelfixed, direction = "backward") :   
number of rows in use has changed: remove missing values?

數據中幾乎每個變量都有一些缺失值,因此我無法刪除所有缺失值(數據= na.omit(data))

關於如何解決此問題的任何想法?

謝謝!!

這可能應該在統計論壇(stats.stackexchange)中,但簡要地講,有許多注意事項。

主要的一點是,當比較兩個模型時,它們需要適合於同一數據集(即,您需要能夠將模型彼此嵌套)。

舉些例子

glm1 <- glm(Dependent~indep1+indep2+indep3, family = binomial, data = data)
glm2 <- glm(Dependent~indep2+indep2, family = binomial, data = data)

現在想象一下,我們缺少indep3的值,但沒有indep1或indep2的值。 當我們運行glm1時,我們正在一個較小的數據集上運行它-我們擁有因變量和所有三個獨立變量的數據集(即,排除了缺少indep3值的任何行)。

當我們運行glm2時,會包含缺少indep3值的行,因為這些行確實包含相關變量indep1和indep2,它們是變量中的模型。

我們無法再直接比較模型,因為它們適合不同的數據集。

我大致上可以:1)限制數據完整2)適當時考慮多重插補

希望能有所幫助。

您可以使用MICE包進行插補,然后使用數據集不會給您帶來錯誤

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM