過濾特定組合或序列

Question

使用 R，我試圖過濾具有特定“決策”序列的 ID，但必須位於相同的“應用程序”編號中。 “決策”順序必須是 C、D、E。 所以我在這里尋找的是

因為 ID“805”具有“決策”序列 C、D、E，並且它們位於相同的“應用程序”編號中。

我嘗試使用 for 循環，如果 else，過濾器，但對我沒有任何作用。 預先感謝您的幫助。

Answer 1

也許如下（如果您提供要復制的數據，而不是圖像，這將很有幫助）：

mydf <- data.frame(ID = c(804, rep(805, 6), rep(806, 3)),
           Application = c(3, 2, rep(3, 4), 4, 2, 3, 3),
           Decision = c(LETTERS[1:5], "A", LETTERS[1:3], "E"))

library(dplyr)
library(tidyr)
library(stringr)

mydf |> 
  group_by(ID, Application) |> 
  summarize(Decision = paste(Decision, collapse = ",")) |> 
  ungroup() |> 
  filter(str_detect(Decision, "C,D,E")) |> 
  separate_rows(Decision, sep = ",") |> 
  filter(Decision %in% c("C", "D", "E"))

# A tibble: 3 × 3
     ID Application Decision
  <dbl>       <dbl> <chr>   
1   805           3 C       
2   805           3 D       
3   805           3 E

Answer 2

您可以使用 tidyverse 中的nest()按ID和Application進行分組。 您只需要使用map_lgl()來處理nest()創建的列內的數據框列表。 迭代運行以下代碼可能會有所幫助，一次添加一行以查看nest()的工作原理：

library(tidyverse)
df = tibble(ID = c(804,
                   rep(805,6),
                   rep(806,3)),
            Application = c(3,2,3,3,3,3,4,2,3,3),
            Decision = c('A','B','C','D','E','A','A','B','C','E'))


df %>% 
  nest(Decision=Decision) %>% 
  filter(Decision %>% 
           map_lgl(~grepl("CDE", paste(.$Decision, collapse="")))) %>% 
  unnest(Decision) %>% 
  filter(Decision %in% c("C","D","E"))

#> # A tibble: 3 × 3
#>      ID Application Decision
#>   <dbl>       <dbl> <chr>   
#> 1   805           3 C       
#> 2   805           3 D       
#> 3   805           3 E

Answer 3

您可以使用以下 data.table 方式實現它。

require(data.table)

data <- data.table(
  ID = c(804, 805, 805, 805, 805, 805, 805, 806, 806, 806),
  Application = c(3, 2, 3, 3, 3, 3, 4, 2, 3, 3),
  Decision = c("A", "B", "C", "D", "E", "A", "A", "B", "C", "E")
)

# Filter Condition on Decision
cond.Decision <- c("C", "D", "E")

data[
  i = ID %in% data[
    j = .(flg = all(cond.Decision %in% Decision)),
    by = ID
  ][i = flg == TRUE, j = ID] & Decision %in% cond.Decision
]
    ID Application Decision
1: 805           3        C
2: 805           3        D
3: 805           3        E

過濾特定組合或序列

問題描述

3 個解決方案

解決方案1
0 2022-07-17 02:18:25

解決方案2
0 2022-07-17 02:44:32

解決方案3
0 2022-07-17 12:05:22

過濾特定組合或序列

問題描述

3 個解決方案

解決方案1 0 2022-07-17 02:18:25

解決方案2 0 2022-07-17 02:44:32

解決方案3 0 2022-07-17 12:05:22

解決方案1
0 2022-07-17 02:18:25

解決方案2
0 2022-07-17 02:44:32

解決方案3
0 2022-07-17 12:05:22