R在ifelse中按组改变一列

Question

我想改变 R data.table中的一列。

这是我的数据示例。

df <- data.table(id=c(1,1,1,2,2,2,3,3,3), 
                 stopId=c("a","b","c","a","b","c","a","b","c"),
category=c(1,1,1,NA,NA,NA,2,2,2),
                 result = c('a','a','a','b','b','b','c','c','c'))

我的目标是使用if-else命令创建一个列。 该列将是groupId group by id的第一个值。

关键是在变异时，值应该按组相同。

如果category是NA ，那么结果应该是groupId的最后一个值。

这是我期待的结果。

   id groupId category result
1:  1       a        1      a
2:  1       b        1      a
3:  1       c        1      a
4:  2       a       NA      b
5:  2       c       NA      b
6:  2       b       NA      b
7:  3       c        2      c
8:  3       b        2      c
9:  3       a        2      c

Answer 1

与data.table ：

df[,result:=fifelse(is.na(category),last(stopId),first(stopId)),by=id][]

   id stopId category result
1:  1      a        1      a
2:  1      b        1      a
3:  1      c        1      a
4:  2      a       NA      c
5:  2      b       NA      c
6:  2      c       NA      c
7:  3      a        2      a
8:  3      b        2      a
9:  3      c        2      a

Answer 2

正如它的名字一样，通过使用first和last ，

df %>%
  group_by(id) %>%
  mutate(resultt = ifelse(is.na(category), last(stopId), first(stopId)))

     id stopId category result resultt
  <dbl> <chr>     <dbl> <chr>  <chr>  
1     1 a             1 a      a      
2     1 b             1 a      a      
3     1 c             1 a      a      
4     2 a            NA b      b      
5     2 c            NA b      b      
6     2 b            NA b      b      
7     3 c             2 c      c      
8     3 b             2 c      c      
9     3 a             2 c      c

您提供的数据与上面不同...

Answer 3

我们可以使用.N或1为每组索引stopId

> df[, result := stopId[ifelse(is.na(category), .N, 1)], id][]
   id stopId category result
1:  1      a        1      a
2:  1      b        1      a
3:  1      c        1      a
4:  2      a       NA      c
5:  2      b       NA      c
6:  2      c       NA      c
7:  3      a        2      a
8:  3      b        2      a
9:  3      c        2      a

或更短

> df[, result := stopId[c(1, .N)[is.na(category) + 1]], id][]
   id stopId category result
1:  1      a        1      a
2:  1      b        1      a
3:  1      c        1      a
4:  2      a       NA      c
5:  2      b       NA      c
6:  2      c       NA      c
7:  3      a        2      a
8:  3      b        2      a
9:  3      c        2      a

R在ifelse中按组改变一列

问题描述

3 个解决方案

解决方案1
4 已采纳 2021-09-06 08:43:31

解决方案2
2 2021-09-06 08:36:06

解决方案3
1 2022-06-28 07:23:58

R在ifelse中按组改变一列

问题描述

3 个解决方案

解决方案1 4 已采纳 2021-09-06 08:43:31

解决方案2 2 2021-09-06 08:36:06

解决方案3 1 2022-06-28 07:23:58

解决方案1
4 已采纳 2021-09-06 08:43:31

解决方案2
2 2021-09-06 08:36:06

解决方案3
1 2022-06-28 07:23:58