繁体   English   中英

R在ifelse中按组改变一列

[英]R mutate a column by group in ifelse

我想改变 R data.table中的一列。

这是我的数据示例。

df <- data.table(id=c(1,1,1,2,2,2,3,3,3), 
                 stopId=c("a","b","c","a","b","c","a","b","c"),
category=c(1,1,1,NA,NA,NA,2,2,2),
                 result = c('a','a','a','b','b','b','c','c','c'))

我的目标是使用if-else命令创建一个列。 该列将是groupId group by id的第一个值。

关键是在变异时,值应该按组相同。

如果categoryNA ,那么结果应该是groupId的最后一个值。

这是我期待的结果。

   id groupId category result
1:  1       a        1      a
2:  1       b        1      a
3:  1       c        1      a
4:  2       a       NA      b
5:  2       c       NA      b
6:  2       b       NA      b
7:  3       c        2      c
8:  3       b        2      c
9:  3       a        2      c

data.table

df[,result:=fifelse(is.na(category),last(stopId),first(stopId)),by=id][]

   id stopId category result
1:  1      a        1      a
2:  1      b        1      a
3:  1      c        1      a
4:  2      a       NA      c
5:  2      b       NA      c
6:  2      c       NA      c
7:  3      a        2      a
8:  3      b        2      a
9:  3      c        2      a

正如它的名字一样,通过使用firstlast

df %>%
  group_by(id) %>%
  mutate(resultt = ifelse(is.na(category), last(stopId), first(stopId)))
     id stopId category result resultt
  <dbl> <chr>     <dbl> <chr>  <chr>  
1     1 a             1 a      a      
2     1 b             1 a      a      
3     1 c             1 a      a      
4     2 a            NA b      b      
5     2 c            NA b      b      
6     2 b            NA b      b      
7     3 c             2 c      c      
8     3 b             2 c      c      
9     3 a             2 c      c 

您提供的数据与上面不同...

我们可以使用.N1为每组索引stopId

> df[, result := stopId[ifelse(is.na(category), .N, 1)], id][]
   id stopId category result
1:  1      a        1      a
2:  1      b        1      a
3:  1      c        1      a
4:  2      a       NA      c
5:  2      b       NA      c
6:  2      c       NA      c
7:  3      a        2      a
8:  3      b        2      a
9:  3      c        2      a

或更短

> df[, result := stopId[c(1, .N)[is.na(category) + 1]], id][]
   id stopId category result
1:  1      a        1      a
2:  1      b        1      a
3:  1      c        1      a
4:  2      a       NA      c
5:  2      b       NA      c
6:  2      c       NA      c
7:  3      a        2      a
8:  3      b        2      a
9:  3      c        2      a

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM