重塑R中的數據框：行到列

Question

原始數據框中有3列：ID，類型和等級。 現在，我想創建一個具有每個類型的可能值的新數據框，作為一個單獨的列（請參見下面的小示例，原始數據包含> 100.000行和30種類型）

data1
id  type  rank
x   a     1
y   a     2
z   a     3
x   b     1
z   b     2
y   c     1     

data2
id  a  b  c
x   1  1  NA
y   2  NA  1
z   3  2  NA

到目前為止，這就是我所做的：

for (i in (1:nrow(data1))) {
  dtype <- data[i,2]
  if (any(data2$id == data1[i,1], na.rm = TRUE)) {
    row <- grep(data1[i,1],data2$id)
    data2[row,c(dtype)] <- data1[i,3]
  } else {
    data2[nrow(data2)+1,1] <- as.character(data1[i,1])
    data2[nrow(data2),c(dtype)] <- data1[i,3]
 }
}

這行得通（我希望這個例子可以解釋我在做什么），但是速度很慢。 您是否有任何提示可以優化該算法？

Answer 1

這是tidyr包中的示例。

library("tidyr")
library("dplyr")
data2<-
   data1 %>% spread(type, rank)

  id a  b  c
1  x 1  1 NA
2  y 2 NA  1
3  z 3  2 NA

Answer 2

使用問題中提到的單詞來使用函數，您可以僅使用基數R的reshape ：

> reshape(mydf, direction = "wide", idvar = "id", timevar = "type")
  id rank.a rank.b rank.c
1  x      1      1     NA
2  y      2     NA      1
3  z      3      2     NA

Answer 3

這里使用data.table ：

require(data.table)
ans = dcast.data.table(setDT(data1), id ~ type)
ans
#    id a  b  c
# 1:  x 1  1 NA
# 2:  y 2 NA  1
# 3:  z 3  2 NA

重塑R中的數據框：行到列

問題描述

3 個解決方案

解決方案1
4 2015-01-19 14:01:11

解決方案2
4 2015-01-19 14:06:30

解決方案3
3 2015-01-19 14:12:32

重塑R中的數據框：行到列

問題描述

3 個解決方案

解決方案1 4 2015-01-19 14:01:11

解決方案2 4 2015-01-19 14:06:30

解決方案3 3 2015-01-19 14:12:32

解決方案1
4 2015-01-19 14:01:11

解決方案2
4 2015-01-19 14:06:30

解決方案3
3 2015-01-19 14:12:32