data.table：与组首位的差异

Question

我有资料

dat <- data.table(id=1:8, group=c(1,1,2,2,2,3,3,3), val=c(4,10,5,10,10,6,10,10))

> dat
   id group val
1:  1     1   4
2:  2     1  10
3:  3     2   5
4:  4     2  10
5:  5     2  10
6:  6     3   6
7:  7     3  10
8:  8     3  10

我想从每个值中减去各自group的第一个值。

> res
   id group val dif
1:  1     1   4   0
2:  2     1  10   6  
3:  3     2   5   0
4:  4     2  10   5   
5:  5     2  10   5
6:  6     3   6   0
7:  7     3  10   4
8:  8     3  10   4

我总是对data.table的效率感到惊讶，所以我想知道它是否可以提供解决方案。 当然，任何其他有效的方法也一样受欢迎。

Answer 1

dat[,diff:=val-val[1],by=group]
dat
   id group val diff
1:  1     1   4    0
2:  2     1  10    6
3:  3     2   5    0
4:  4     2  10    5
5:  5     2  10    5
6:  6     3   6    0
7:  7     3  10    4
8:  8     3  10    4

Answer 2

使用Tidyverse（dplyr），您可以执行以下操作：

library(dplyr)

dat <- data.table(id=1:8,
  group=c(1,1,2,2,2,3,3,3), 
  val=c(4,10,5,10,10,6,10,10)
  )  

dat %>%
  group_by(group) %>%
  mutate(dif = abs(first(val)-val))

#># A tibble: 8 x 4
#># Groups:   group [3]
#>     id group   val   dif
#>  <int> <dbl> <dbl> <dbl>
#>1     1  1.00  4.00  0   
#>2     2  1.00 10.0   6.00
#>3     3  2.00  5.00  0   
#>4     4  2.00 10.0   5.00
#>5     5  2.00 10.0   5.00
#>6     6  3.00  6.00  0   
#>7     7  3.00 10.0   4.00
#>8     8  3.00 10.0   4.00

data.table：与组首位的差异

问题描述

2 个解决方案

解决方案1
2 已采纳 2018-02-27 17:04:17

解决方案2
0 2018-02-27 17:07:43

data.table：与组首位的差异

问题描述

2 个解决方案

解决方案1 2 已采纳 2018-02-27 17:04:17

解决方案2 0 2018-02-27 17:07:43

解决方案1
2 已采纳 2018-02-27 17:04:17

解决方案2
0 2018-02-27 17:07:43