簡體   English   中英

R中的model.matrix

[英]model.matrix in R

我正在處理一個數據集,該數據集僅包含作為預測變量的多級因子和一個二進制響應變量。 當前這是一個數據幀。 我想在集合上運行glmnet,因此我需要構建一個模型矩陣(model.matrix)。 我在這里閱讀了R模型矩陣中因子的所有層次,每個因子的特定層次被視為層次。 但是,我不知道這是否是因為在這種情況下存在數值和因子變量? 無論如何,有人可以粗略地告訴我如何從MASS的mtcars數據集構建模型矩陣

這是一個猜測,因為您尚未描述所使用的功能。 我的直覺是,您正在使用一種“機器學習”算法,該算法需要您提供單獨的響應向量和預測矩陣。 (如果我在這件事上錯了,那么您肯定需要提供更多詳細信息。)

假設您將mpg用作“結果” Y變量,僅使用第2個和第三個變量,並且僅在第一個變量中構造“虛擬變量”,這將是一個model.matrix調用,它可以構建適當的X對象:

> model.matrix(~as.factor(cyl)+disp, mtcars[2:3])
                    (Intercept) as.factor(cyl)6 as.factor(cyl)8  disp
Mazda RX4                     1               1               0 160.0
Mazda RX4 Wag                 1               1               0 160.0
Datsun 710                    1               0               0 108.0
Hornet 4 Drive                1               1               0 258.0
Hornet Sportabout             1               0               1 360.0
Valiant                       1               1               0 225.0
Duster 360                    1               0               1 360.0
Merc 240D                     1               0               0 146.7
Merc 230                      1               0               0 140.8
Merc 280                      1               1               0 167.6
Merc 280C                     1               1               0 167.6
Merc 450SE                    1               0               1 275.8
##########Snipped remainder of output.

公式對象指定模型的性質。 (Intercept)項將是引用所有因子變量的共享基准級別。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM