簡體   English   中英

定性預測變量未出現在回歸摘要輸出R中

[英]Qualitative predictor variables not appearing in regression summary output R

我有一個很大的數據集,可用來運行帶有一些定性預測變量的線性回歸模型。 我將數據集稱為WN,質性變量為OState和DState(美國的州)。 在這里,您將看到WN中有62個唯一的OState和DState值:

> unique(WN$OState)
[1] NY MA PA DE DC VA MD WV NC RI SC NH GA FL AL TN MS ME KY OH IN MI VT IA WI MN SD ND MT CT IL MO KS NE NJ LA AR OK TX CO WY ID UT AZ NM NV CA OR WA
62 Levels: AA AE AK AL AP AR AS AZ CA CO CT DC DE FL FM GA GU HI IA ID IL IN KS KY LA MA MD ME MH MI MN MO MP MS MT NC ND NE NH NJ NM NV NY OH OK OR PA PR PW RI SC SD TN TX UT VA VI VT WA ... WY
> unique(WN$DState)
[1] MA RI NH ME VT CT NY NJ PA DE DC VA MD WV NC SC GA FL AL TN MS KY OH IN MI IA WI MN SD ND MT IL MO KS NE LA AR OK TX CO WY ID UT AZ NM NV CA OR WA
62 Levels: AA AE AK AL AP AR AS AZ CA CO CT DC DE FL FM GA GU HI IA ID IL IN KS KY LA MA MD ME MH MI MN MO MP MS MT NC ND NE NH NJ NM NV NY OH OK OR PA PR PW RI SC SD TN TX UT VA VI VT WA ... WY

現在,我正在運行回歸模型來預測帶距離,OState和DState的速率,如下所示:

> WN.LR = lm(WN$Rate~WN$Distance+WN$OState+WN$DState) 

當我檢查回歸摘要時,我看到只有48個OState和DState預測變量被填充,其余14個缺失。 下面給出了摘要輸出的一小部分。 例如,您將看到輸出中缺少OStateAL:

> summary(WN.LR)

Call:
lm(formula = WN$Rate ~ WN$Distance + WN$OState + WN$DState)

Residuals:
    Min      1Q  Median      3Q     Max 
-2370.3  -218.4   -18.9   170.8  9105.7 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.208e+03  6.632e+00 182.171  < 2e-16 ***
WN$Distance  1.626e+00  3.111e-03 522.722  < 2e-16 ***
WN$OStateAR  2.000e+02  7.294e+00  27.419  < 2e-16 ***
WN$OStateAZ  1.981e+02  8.372e+00  23.667  < 2e-16 ***
WN$OStateCA  1.056e+02  7.919e+00  13.340  < 2e-16 ***
WN$OStateCO  1.323e+02  7.332e+00  18.043  < 2e-16 ***
WN$OStateCT -2.019e+02  1.827e+01 -11.048  < 2e-16 ***
WN$OStateDC  5.711e+02  2.178e+01  26.223  < 2e-16 ***

另一方面,當我使用OState =“ AL”檢查實體時,發現有6000多個行:

> WNnew<-subset(WN,OState=="AL")
> nrow(WNnew)
[1] 6213

有什么解釋嗎?

這可能是由於混疊(即,您的模型被過度標識)造成的。 例如,馬薩諸塞州在您的DStateOState變量中都是一個級別,因此我認為它在兩種處理方式中的作用無法分開。

構建模型時,您沒有閱讀警告,即系數列表中的所有NA。 運行時將列出別名術語:

WN.LR  # always look at the output of `lm` as well as that of `summary.lm`

...而您只是無法讀取輸出。 您可能會考慮在OState中創建一個“相同”級別,其中DState與OState相同,然后允許捕獲沒有差異的所有狀態。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM