[英]Qualitative predictor variables not appearing in regression summary output R
我有一個很大的數據集,可用來運行帶有一些定性預測變量的線性回歸模型。 我將數據集稱為WN,質性變量為OState和DState(美國的州)。 在這里,您將看到WN中有62個唯一的OState和DState值:
> unique(WN$OState)
[1] NY MA PA DE DC VA MD WV NC RI SC NH GA FL AL TN MS ME KY OH IN MI VT IA WI MN SD ND MT CT IL MO KS NE NJ LA AR OK TX CO WY ID UT AZ NM NV CA OR WA
62 Levels: AA AE AK AL AP AR AS AZ CA CO CT DC DE FL FM GA GU HI IA ID IL IN KS KY LA MA MD ME MH MI MN MO MP MS MT NC ND NE NH NJ NM NV NY OH OK OR PA PR PW RI SC SD TN TX UT VA VI VT WA ... WY
> unique(WN$DState)
[1] MA RI NH ME VT CT NY NJ PA DE DC VA MD WV NC SC GA FL AL TN MS KY OH IN MI IA WI MN SD ND MT IL MO KS NE LA AR OK TX CO WY ID UT AZ NM NV CA OR WA
62 Levels: AA AE AK AL AP AR AS AZ CA CO CT DC DE FL FM GA GU HI IA ID IL IN KS KY LA MA MD ME MH MI MN MO MP MS MT NC ND NE NH NJ NM NV NY OH OK OR PA PR PW RI SC SD TN TX UT VA VI VT WA ... WY
現在,我正在運行回歸模型來預測帶距離,OState和DState的速率,如下所示:
> WN.LR = lm(WN$Rate~WN$Distance+WN$OState+WN$DState)
當我檢查回歸摘要時,我看到只有48個OState和DState預測變量被填充,其余14個缺失。 下面給出了摘要輸出的一小部分。 例如,您將看到輸出中缺少OStateAL:
> summary(WN.LR)
Call:
lm(formula = WN$Rate ~ WN$Distance + WN$OState + WN$DState)
Residuals:
Min 1Q Median 3Q Max
-2370.3 -218.4 -18.9 170.8 9105.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.208e+03 6.632e+00 182.171 < 2e-16 ***
WN$Distance 1.626e+00 3.111e-03 522.722 < 2e-16 ***
WN$OStateAR 2.000e+02 7.294e+00 27.419 < 2e-16 ***
WN$OStateAZ 1.981e+02 8.372e+00 23.667 < 2e-16 ***
WN$OStateCA 1.056e+02 7.919e+00 13.340 < 2e-16 ***
WN$OStateCO 1.323e+02 7.332e+00 18.043 < 2e-16 ***
WN$OStateCT -2.019e+02 1.827e+01 -11.048 < 2e-16 ***
WN$OStateDC 5.711e+02 2.178e+01 26.223 < 2e-16 ***
另一方面,當我使用OState =“ AL”檢查實體時,發現有6000多個行:
> WNnew<-subset(WN,OState=="AL")
> nrow(WNnew)
[1] 6213
有什么解釋嗎?
這可能是由於混疊(即,您的模型被過度標識)造成的。 例如,馬薩諸塞州在您的DState
和OState
變量中都是一個級別,因此我認為它在兩種處理方式中的作用無法分開。
構建模型時,您沒有閱讀警告,即系數列表中的所有NA。 運行時將列出別名術語:
WN.LR # always look at the output of `lm` as well as that of `summary.lm`
...而您只是無法讀取輸出。 您可能會考慮在OState中創建一個“相同”級別,其中DState與OState相同,然后允許捕獲沒有差異的所有狀態。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.