如何使用dplyr根据另一列的不同值在新列中填充不同的值？

Question

这是我的数据：

a <- data.frame(x=c('A','A','A','B','B','B'),
                y=c('Yes','No','No','Yes','No','No'),
                z=c(1,2,3,4,5,6))

我想以这种方式生成一个新列：

按x分组，因此所有A都在一个组中，所有B在另一个组中
对于每个组，如果y=Yes ，则将z值保留在新列中。 如果y=No ，则将z值与y=Yes 。

因此，新数据应如下所示：

x    y   z   z1
A   Yes  1   1
A   No   2   1
A   No   3   1
B   Yes  4   4
B   No   5   4
B   No   6   4

我可以用这种方式来做：

a1 <- a %>%
   filter(y=='Yes') %>%
   distinct(x,y,z)
 a2 <- a %>%
    left_join(a1,by='x') %>%...

但是以这种方式，我必须生成a1作为中间体。 在我的示例中，如何仅在一个管道中执行此操作而不生成像a1这样的新变量？

Answer 1

您可以将两个管道结合在一起，一次执行相同的功能。

即..

    a <- data.frame(x=c('A','A','A','B','B','B'),
                    y=c('Yes','No','No','Yes','No','No'),
                    z=c(1,2,3,4,5,6))

    a %>% left_join(a %>% filter(y=='Yes') %>% distinct(x,y,z), by='x') %>% select(-y.y)

作为连接的结果，这将导致使用.x和.y标记的重复列。

如何使用dplyr根据另一列的不同值在新列中填充不同的值？

问题描述

1 个解决方案

解决方案1
1 已采纳 2018-03-28 02:46:38

如何使用dplyr根据另一列的不同值在新列中填充不同的值？

问题描述

1 个解决方案

解决方案1 1 已采纳 2018-03-28 02:46:38

解决方案1
1 已采纳 2018-03-28 02:46:38