將因子數據重塑為矩陣

Question

在數據中重塑因子列的正確/簡短方法是什么：

login has_profile_in
1234  Facebook
1234  LinkedIn
1235  VK

變成這樣的矩陣：

login Facebook LinkedIn VK
1234     1        1      0
1235     0        0      1

使用提迪爾管道？

編輯：我知道一些常規的方法，例如reshape2

dcast(login~has_profile_in)

還有其他方法。 我的問題是如何以整齊的方式做到這一點，包括在基於通用管道的框架中進行操作

Answer 1

您可以使用aggregate

aggregate(has_profile_in ~ login, df, table)


#   login has_profile_in.Facebook has_profile_in.LinkedIn has_profile_in.VK
#1  1234                       1                       1                 0
#2  1235                       0                       0                 1

您可以使用setNames重命名列並使其更具可讀性

setNames(aggregate(has_profile_in ~ login, df, table), c("Login", ""))

# Login   .Facebook .LinkedIn .VK
#1  1234         1         1   0
#2  1235         0         0   1

Answer 2

如OP所要求的tidyr法

library(dplyr)
library(tidyr)
df1 %>% 
   mutate(Count = 1) %>%
   spread(has_profile_in, Count, fill = 0)
#   login Facebook LinkedIn VK
#1  1234        1        1  0
#2  1235        0        0  1

最短的選擇是table

 as.data.frame.matrix(+(table(df1)!=0))
 #     Facebook LinkedIn VK
 #1234        1        1  0
 #1235        0        0  1

或使用data.table

library(data.table)
dcast(setDT(df1), login~has_profile_in, function(x) +(length(x)!=0))
#    login Facebook LinkedIn VK
#1:  1234        1        1  0
#2:  1235        0        0  1

注意： dcast可能是最快的，但投票仍在進行中，或者活動仍在進行中。

Answer 3

您可以使用

model.matrix(~yourFactor+0)

將因子數據重塑為矩陣

問題描述

3 個解決方案

解決方案1
3 2016-06-20 11:37:40

解決方案2
1 已采納 2016-06-20 11:30:06

解決方案3
1 2016-06-20 11:30:58

將因子數據重塑為矩陣

問題描述

3 個解決方案

解決方案1 3 2016-06-20 11:37:40

解決方案2 1 已采納 2016-06-20 11:30:06

解決方案3 1 2016-06-20 11:30:58

解決方案1
3 2016-06-20 11:37:40

解決方案2
1 已采納 2016-06-20 11:30:06

解決方案3
1 2016-06-20 11:30:58