為 dplyr 中的分組變量中的連續行分配唯一 ID

Question

假設我有以下data.frame：

a <- data.frame(group = "A", value = rnorm(mean = 1, sd = 2, n = 150))
b <- data.frame(group = "B", value = rnorm(mean = 1, sd = 2, n = 150))
c <- data.frame(group = "C", value = rnorm(mean = 1, sd = 2, n = 150))
df <- bind_rows(a, b, c)

我想為分組變量（ group ）中的每對連續行創建一個唯一 ID，例如：

df %>% group_by(group) %>% mutate(...)

所以組內的每個“二元組”都應該有一個唯一的 ID

有任何想法嗎？

Answer 1

我們可以使用gl

library(dplyr)
df <- df %>%
    group_by(group) %>% 
    mutate(id = as.integer(gl(n(), 2, n()))) %>%
    ungroup

Answer 2

另一個dplyr選項使用ceiling + row_number()

df %>%
  group_by(group) %>%
  mutate(id = ceiling(row_number() / 2)) %>%
  ungroup()

Answer 3

另一種選擇是使用rep function：

df %>%
  group_by(group) %>%
  mutate(id = rep(seq(n()), each = 2, length = n())) %>%
  ungroup()

為 dplyr 中的分組變量中的連續行分配唯一 ID

問題描述

3 個解決方案

解決方案1
4 已采納 2021-04-18 23:17:33

解決方案2
2 2021-04-18 23:23:48

解決方案3
2 2021-04-18 23:26:00

為 dplyr 中的分組變量中的連續行分配唯一 ID

問題描述

3 個解決方案

解決方案1 4 已采納 2021-04-18 23:17:33

解決方案2 2 2021-04-18 23:23:48

解決方案3 2 2021-04-18 23:26:00

解決方案1
4 已采納 2021-04-18 23:17:33

解決方案2
2 2021-04-18 23:23:48

解決方案3
2 2021-04-18 23:26:00