[英]Stepwise regression error in R
我想在R中運行逐步回歸以選擇最佳擬合模型,我的代碼附在這里:
full.modelfixed <- glm(died_ed ~ age_1 + gender + race + insurance + injury + ais + blunt_pen +
comorbid + iss +min_dist + pop_dens_new + age_mdn + male_pct +
pop_wht_pct + pop_blk_pct + unemp_pct + pov_100x_npct +
urban_pct, data = trauma, family = binomial (link = 'logit'), na.action = na.exclude)
reduced.modelfixed <- stepAIC(full.modelfixed, direction = "backward")
有錯誤消息說
Error in stepAIC(full.modelfixed, direction = "backward") :
number of rows in use has changed: remove missing values?
數據中幾乎每個變量都有一些缺失值,因此我無法刪除所有缺失值(數據= na.omit(data))
關於如何解決此問題的任何想法?
謝謝!!
這可能應該在統計論壇(stats.stackexchange)中,但簡要地講,有許多注意事項。
主要的一點是,當比較兩個模型時,它們需要適合於同一數據集(即,您需要能夠將模型彼此嵌套)。
舉些例子
glm1 <- glm(Dependent~indep1+indep2+indep3, family = binomial, data = data)
glm2 <- glm(Dependent~indep2+indep2, family = binomial, data = data)
現在想象一下,我們缺少indep3的值,但沒有indep1或indep2的值。 當我們運行glm1時,我們正在一個較小的數據集上運行它-我們擁有因變量和所有三個獨立變量的數據集(即,排除了缺少indep3值的任何行)。
當我們運行glm2時,會包含缺少indep3值的行,因為這些行確實包含相關變量indep1和indep2,它們是變量中的模型。
我們無法再直接比較模型,因為它們適合不同的數據集。
我大致上可以:1)限制數據完整2)適當時考慮多重插補
希望能有所幫助。
您可以使用MICE包進行插補,然后使用數據集不會給您帶來錯誤
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.