識別由 NA 分隔的組

Question

我想將分組列添加到我的數據中。 我的數據是文本列，並且有 NA 分隔組。 這是示例，組是我想要實現的結果。 我不知道每組將包含多少行，但總是有 NA 分隔組（最后一組除外）。 那么如何創建組列呢？

library(tidyverse)

data <- tibble(raw = c("This", "Is", "First", NA, "This", "Is", "Second", NA, "And", "Third"),
               group = c(1,1,1,1,2,2,2,2,3,3))

Answer 1

一種選擇是根據NA值創建一個邏輯向量並使用cumsum

library(dplyr)
data %>% 
      mutate(groupNew = cumsum(lag(is.na(raw), default = TRUE)) )
# A tibble: 10 x 3
#   raw    group groupNew
#   <chr>  <dbl>    <int>
# 1 This       1        1
# 2 Is         1        1
# 3 First      1        1
# 4 <NA>       1        1
# 5 This       2        2
# 6 Is         2        2
# 7 Second     2        2
# 8 <NA>       2        2
# 9 And        3        3
#10 Third      3        3

Answer 2

如果當前值不是 NA，則取 NA 的累積和並加一。

data %>% mutate(group = cumsum(is.na(raw)) + !is.na(raw))

識別由 NA 分隔的組

問題描述

2 個解決方案

解決方案1
0 2020-01-01 22:51:08

解決方案2
0 已采納 2020-01-01 22:54:38

識別由 NA 分隔的組

問題描述

2 個解決方案

解決方案1 0 2020-01-01 22:51:08

解決方案2 0 已采納 2020-01-01 22:54:38

解決方案1
0 2020-01-01 22:51:08

解決方案2
0 已采納 2020-01-01 22:54:38