tidyverse：根據其他行中的值從數據框中刪除行

Question

我有一些調查數據。 每行代表對“受訪者”的采訪。 一些受訪者接受了一次采訪。 其他人被多次采訪。 我想從這個小標題中選擇每個受訪者的最后一次采訪。

這是一個最小的示例：

tmp <- tribble(
  ~YYYYMM, ~ID, ~DATEPR, ~IDPREV,
   198001,   1,      NA,      NA,
   198001,   2,      NA,      NA,
   198001,   3,      NA,      NA,
   198002,   1,      198001,   1,
   198002,   2,      NA,      NA,
   198002,   3,      NA,      NA,
   198003,   1,      198002,   1,
   198003,   2,      NA,      NA,
   198003,   3,      198002,   3)

哪里

YYYYMM是面試的日期。
DATEPR是受訪者上一次面談的日期（如果有的話）。
ID僅在訪談波中唯一。 這意味着，例如，被申請人為誰ID==2和YYYMM==198001不必是為誰答辯ID==2和YYYMM==198002 。
IDPREV是受訪者上一次采訪的ID（如果有的話）。

上面的小標題中有九行。 但是一位受訪者接受了三次采訪，另一位受訪者被了兩次采訪。 我只希望每位受訪者進行最后一次面試，所以我只希望排成六列。 這段代碼完成了這項工作：

for (i in 1:nrow(tmp)) {
  if (!is.na(tmp$DATEPR[i])) {
    ind <- which(tmp$YYYYMM == tmp$DATEPR[i] & tmp$ID == tmp$IDPREV[i])
    tmp <- tmp[-ind, ]
  }
}

但是似乎很難解析。 是否有更清晰的方法可以使用tidyverse函數達到相同的目的？ 我想到了一個兩步函數：首先，獲取要刪除的所有行的索引； 第二，刪除行。 但是我無法通過map或dplyr函數實現此解決方案。

Answer 1

如果所有先前訪問的ID都列在第3列和第4列，則可以使用dplyr::anti_join自身進行數據框的左anti_join ，在這里，您分別將DATEPR和IDPREV與YYYYMM和ID匹配，僅匹配temp的行沒有匹配的YYYYMM和ID ：

anti_join(tmp, tmp, by = c("YYYYMM" = "DATEPR", "ID" = "IDPREV")) %>% 
    arrange(YYYYMM, ID)

# A tibble: 6 x 4
#  YYYYMM    ID DATEPR IDPREV
#   <dbl> <dbl>  <dbl>  <dbl>
#1 198001     2     NA     NA
#2 198001     3     NA     NA
#3 198002     2     NA     NA
#4 198003     1 198002      1
#5 198003     2     NA     NA
#6 198003     3 198002      3

運行代碼后：

for (i in 1:nrow(tmp)) {
    if (!is.na(tmp$DATEPR[i])) {
        ind <- which(tmp$YYYYMM == tmp$DATEPR[i] & tmp$ID == tmp$IDPREV[i])
        tmp <- tmp[-ind, ]
    }
}
tmp %>% arrange(YYYYMM, ID)
# A tibble: 6 x 4
#  YYYYMM    ID DATEPR IDPREV
#   <dbl> <dbl>  <dbl>  <dbl>
#1 198001     2     NA     NA
#2 198001     3     NA     NA
#3 198002     2     NA     NA
#4 198003     1 198002      1
#5 198003     2     NA     NA
#6 198003     3 198002      3

tidyverse：根據其他行中的值從數據框中刪除行

問題描述

1 個解決方案

解決方案1
2 已采納 2017-09-29 22:49:25

tidyverse：根據其他行中的值從數據框中刪除行

問題描述

1 個解決方案

解決方案1 2 已采納 2017-09-29 22:49:25

解決方案1
2 已采納 2017-09-29 22:49:25