簡體   English   中英

具有時間間隔重疊的組記錄

[英]Group records with time interval overlap

我有一個數據框(N=16)包含 ID(字符)、w_from(日期)和 w_to(日期)。 每條記錄代表一個任務。

這是 R 中的數據。

ID <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2)

w_from <- c("2010-01-01","2010-01-05","2010-01-29","2010-01-29",
            "2010-03-01","2010-03-15","2010-07-15","2010-09-10",
            "2010-11-01","2010-11-30","2010-12-15","2010-12-31",
            "2011-02-01","2012-04-01","2011-07-01","2011-07-01")

w_to <- c("2010-01-31","2010-01-15", "2010-02-13","2010-02-28",
          "2010-03-16","2010-03-16","2010-08-14","2010-10-10",
          "2010-12-01","2010-12-30","2010-12-20","2011-02-19",
          "2011-03-23","2012-06-30","2011-07-31","2011-07-06")

df <- data.frame(ID, w_from, w_to)
df$w_from <- as.Date(df$w_from)
df$w_to <- as.Date(df$w_to)

我需要為它們的時間間隔重疊的記錄按 ID 生成一個組號。 作為示例並且一般而言,如果記錄#1與記錄#2重疊,並且記錄#2與記錄#3重疊,則記錄#1、記錄#2和記錄#3重疊。

此外,如果記錄#1 與記錄#2 和記錄#3 重疊,但記錄#2 不與記錄#3 重疊,那么記錄#1、記錄#2、記錄#3 都是重疊的。

在上面的示例中,對於 ID=1,前四個記錄重疊。

在此處輸入圖像描述

這是最終的 output:

在此處輸入圖像描述

此外,如果這可以使用 dplyr 來完成,那就太好了!

嘗試這個:

library(dplyr)
df %>% 
  group_by(ID) %>%
  arrange(w_from) %>% 
  mutate(group = 1+cumsum(
    cummax(lag(as.numeric(w_to), default = first(as.numeric(w_to)))) < as.numeric(w_from)))

# A tibble: 16 x 4
# Groups:   ID [2]
      ID w_from     w_to       group
   <dbl> <date>     <date>     <dbl>
 1     1 2010-01-01 2010-01-31     1
 2     1 2010-01-05 2010-01-15     1
 3     1 2010-01-29 2010-02-13     1
 4     1 2010-01-29 2010-02-28     1
 5     1 2010-03-01 2010-03-16     2
 6     1 2010-03-15 2010-03-16     2
 7     1 2010-07-15 2010-08-14     3
 8     1 2010-09-10 2010-10-10     4
 9     1 2010-11-01 2010-12-01     5
10     1 2010-11-30 2010-12-30     5
11     1 2010-12-15 2010-12-20     5
12     1 2010-12-31 2011-02-19     6
13     1 2011-02-01 2011-03-23     6
14     2 2011-07-01 2011-07-31     1
15     2 2011-07-01 2011-07-06     1
16     2 2012-04-01 2012-06-30     2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM