[英]model.matrix in R
我正在處理一個數據集,該數據集僅包含作為預測變量的多級因子和一個二進制響應變量。 當前這是一個數據幀。 我想在集合上運行glmnet,因此我需要構建一個模型矩陣(model.matrix)。 我在這里閱讀了R模型矩陣中因子的所有層次,每個因子的特定層次被視為層次。 但是,我不知道這是否是因為在這種情況下存在數值和因子變量? 無論如何,有人可以粗略地告訴我如何從MASS的mtcars
數據集構建模型矩陣
這是一個猜測,因為您尚未描述所使用的功能。 我的直覺是,您正在使用一種“機器學習”算法,該算法需要您提供單獨的響應向量和預測矩陣。 (如果我在這件事上錯了,那么您肯定需要提供更多詳細信息。)
假設您將mpg
用作“結果” Y變量,僅使用第2個和第三個變量,並且僅在第一個變量中構造“虛擬變量”,這將是一個model.matrix調用,它可以構建適當的X對象:
> model.matrix(~as.factor(cyl)+disp, mtcars[2:3])
(Intercept) as.factor(cyl)6 as.factor(cyl)8 disp
Mazda RX4 1 1 0 160.0
Mazda RX4 Wag 1 1 0 160.0
Datsun 710 1 0 0 108.0
Hornet 4 Drive 1 1 0 258.0
Hornet Sportabout 1 0 1 360.0
Valiant 1 1 0 225.0
Duster 360 1 0 1 360.0
Merc 240D 1 0 0 146.7
Merc 230 1 0 0 140.8
Merc 280 1 1 0 167.6
Merc 280C 1 1 0 167.6
Merc 450SE 1 0 1 275.8
##########Snipped remainder of output.
公式對象指定模型的性質。 (Intercept)項將是引用所有因子變量的共享基准級別。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.