如何根據 NA 與字母表對值進行分組

Question

我在LETTER中有一列字母值按字母順序排列，部分穿插有NA ：

df1 <- data.frame(
  phase = c(NA, "A", "B", "D", NA, "A", "B", "C", "E", "A", "B", "D")
)

LETTER值形成組：從A到下一個NA或下一個A的任何內容都是一個組。 我想創建一個新列來明確這些組。

預期的結果是這樣的：

df1 <- data.frame(
  phase = c(NA, "A", "B", "D", NA, "A", "B", "C", "E", "A", "B", "D"),
  group = c(NA,"group1","group1","group1",NA, "group2","group2","group2","group2","group3","group3","group3")
)

我怎樣才能創建這個專欄？ 我很感激任何建議，基於dplyr或其他。

到目前為止我已經嘗試過的——只取得了部分成功（第三組與第二組沒有被NA分開，被遺漏了）：

df1 %>% 
  mutate(group = cumsum(is.na(phase)),
         group = ifelse(is.na(phase), NA, paste("group", group, sep = "")))

   phase  group
1   <NA>   <NA>
2      A group1
3      B group1
4      D group1
5   <NA>   <NA>
6      A group2
7      B group2
8      C group2
9      E group2
10     A group2
11     B group2
12     D group2

Answer 1

如果階段是"A" ，跳轉到下一組。 然后在phase為NA時用NA替換這些組。

library(dplyr)

df1 %>%
  mutate(group = cumsum(phase == "A" & !is.na(phase)) %>%
                 paste0("group", .) %>% 
                 replace(is.na(phase), NA))

#    phase  group
# 1   <NA>   <NA>
# 2      A group1
# 3      B group1
# 4      D group1
# 5   <NA>   <NA>
# 6      A group2
# 7      B group2
# 8      C group2
# 9      E group2
# 10     A group3
# 11     B group3
# 12     D group3

Answer 2

我們也可以做

library(dplyr)
library(stringr)
df1 %>% 
   mutate(group = str_c('group', cumsum(phase %in% 'A') * NA^is.na(phase)))
#  phase  group
#1   <NA>   <NA>
#2      A group1
#3      B group1
#4      D group1
#5   <NA>   <NA>
#6      A group2
#7      B group2
#8      C group2
#9      E group2
#10     A group3
#11     B group3
#12     D group3

如何根據 NA 與字母表對值進行分組

問題描述

2 個解決方案

解決方案1
2 已采納 2020-08-03 16:30:37

解決方案2
1 2020-08-03 19:39:13

如何根據 NA 與字母表對值進行分組

問題描述

2 個解決方案

解決方案1 2 已采納 2020-08-03 16:30:37

解決方案2 1 2020-08-03 19:39:13

解決方案1
2 已采納 2020-08-03 16:30:37

解決方案2
1 2020-08-03 19:39:13