将R中的多个变量的数据重整为宽到长

Question

我有一个数据集，显示每个银行的投资以及与此投资相关的美元价值。 当前数据看起来像这样。 我有inv和amt变量，范围从1扩展到43。

bankid year location inv1   amt1 inv2 amt2 ... inv43 amt43 
1          1990 NYC      AIG    2000 GM   4000     Ford  6000

但我希望数据看起来像这样

bankid year location inv number amt
1      1990  NYC     AIG  1     2000  
1      1990  NYC     GM   2     4000
...
1      1990  NYC     Ford 43    6000

在Stata中，我将使用此代码

reshape long inv amt, i(bankid location year) j(number)

R中的等效代码是什么？

Answer 1

reshape可以做到这一点。 在这里，我使用的是发布的数据子集，其中有时间变量1、2和43：

x <- read.table(header=TRUE, text='bankid year location inv1   amt1 inv2 amt2  inv43 amt43 
1          1990 NYC      AIG    2000 GM   4000     Ford  6000 ')
x
##   bankid year location inv1 amt1 inv2 amt2 inv43 amt43
## 1      1 1990      NYC  AIG 2000   GM 4000  Ford  6000

v <- outer(c('inv', 'amt'), c(1,2,43), FUN=paste0)
v
##      [,1]   [,2]   [,3]   
## [1,] "inv1" "inv2" "inv43"
## [2,] "amt1" "amt2" "amt43"

reshape(x, direction='long', varying=c(v), sep='')
##      bankid year location time  inv  amt id
## 1.1       1 1990      NYC    1  AIG 2000  1
## 1.2       1 1990      NYC    2   GM 4000  1
## 1.43      1 1990      NYC   43 Ford 6000  1

对于您的整个表， varying参数将为c(outer(c('inv', 'amt'), 1:43, FUN=paste0)) （但是对于小示例而言，它将不起作用，因为缺少列）。

这里， reshape通过检查推断“时间”变量varying参数，并找到共同的元件（ inv和amt在左侧），和其他元素在右侧（ 1 ， 2 ，和43 ）。 sep参数说没有分隔符（默认的sep字符是. ）。

将R中的多个变量的数据重整为宽到长

问题描述

1 个解决方案

解决方案1
2 2014-09-07 19:01:45

将R中的多个变量的数据重整为宽到长

问题描述

1 个解决方案

解决方案1 2 2014-09-07 19:01:45

解决方案1
2 2014-09-07 19:01:45