根据条件变异？

Question

df <- data.frame(x1 = c("a","a","a","a","b","b","b","b"),ind = c("O","O","C","C","O","O","O","O"), num = c(6,12,18,24,6,12,18,24))
set.seed(1)
df <- df[sample(nrow(df)),]


df2 <- df %>% group_by(x1) %>%
  arrange(x1,num) 
> df2
# A tibble: 8 x 3
# Groups:   x1 [2]
  x1    ind     num
  <fct> <fct> <dbl>
1 a     O         6
2 a     O        12
3 a     C        18
4 a     C        24
5 b     O         6
6 b     O        12
7 b     O        18
8 b     O        24

我想为此数据创建一些新列，第一个应该检查列x1的每个唯一值，它应该采用列ind等于C的列num的最小值。 对于值a这应该返回18 。 然后它再次执行此操作，但检查ind何时等于O 如果它什么也没找到，那么它应该只返回 N/A。 所以这两列应该是这样的结果：

  x1    ind     num min_O min_C
  <fct> <fct> <dbl> <dbl> <dbl>
1 a     O         6     6    18
2 a     O        12     6    18
3 a     C        18     6    18
4 a     C        24     6    18
5 b     O         6     6    NA
6 b     O        12     6    NA
7 b     O        18     6    NA
8 b     O        24     6    NA

我尝试了按x1和ind列进行分组的变体，但无法使其工作，因为如果它等于特定值，我想做一个最小值。 我相信有一个简单的方法！

Answer 1

这看起来有点麻烦，但确实有效

library(dplyr)
library(tidyr)

df2 %>% 
 group_by(x1, ind) %>% 
 pivot_wider(names_from = ind, values_from = num, values_fn = min, names_prefix = 'min_') %>% 
 left_join(df2, by = 'x1')

# A tibble: 8 x 5
# Groups:   x1 [2]
  x1    min_O min_C ind     num
  <chr> <dbl> <dbl> <chr> <dbl>
1 a         6    18 O         6
2 a         6    18 O        12
3 a         6    18 C        18
4 a         6    18 C        24
5 b         6    NA O         6
6 b         6    NA O        12
7 b         6    NA O        18
8 b         6    NA O        24

Answer 2

另一种方式可能是

library(tidyr)
library(dplyr)
df %>%
  arrange(x1,num) %>% 
  group_by(x1) %>%
  mutate(min_C = min(num[ind == "C"]), 
         min_O = min(num[ind == "O"]),
         across(starts_with("min"), ~ ifelse(.x == Inf, NA_real_, .x)))

返回

# A tibble: 8 x 5
# Groups:   x1 [2]
  x1    ind     num min_C min_O
  <chr> <chr> <dbl> <dbl> <dbl>
1 a     O         6    18     6
2 a     O        12    18     6
3 a     C        18    18     6
4 a     C        24    18     6
5 b     O         6    NA     6
6 b     O        12    NA     6
7 b     O        18    NA     6
8 b     O        24    NA     6

但也会返回警告，因为b组中没有C 。

如果您不使用across(...)部分，则NA将替换为Inf 。

根据条件变异？

问题描述

2 个解决方案

解决方案1
2 已采纳 2021-06-14 11:10:07

解决方案2
1 2021-06-14 11:49:10

根据条件变异？

问题描述

2 个解决方案

解决方案1 2 已采纳 2021-06-14 11:10:07

解决方案2 1 2021-06-14 11:49:10

解决方案1
2 已采纳 2021-06-14 11:10:07

解决方案2
1 2021-06-14 11:49:10