如何在出現此值的第一個實例的行中排除所有值？ (R Dplyr)

Question

我有一個數據集，df

Subject

Hi
hello
RE: Hello
RE: How is work
No
Ok
RE: What time are 
Hello RE: are you

我想排除第一個單詞是 RE 的所有行：

主題

Hi
hello
No
Ok
Hello RE: are you

這是dput：

 structure(list(Subject = structure(c(2L, 1L, 5L, 6L, 3L, 4L, 
 7L), .Label = c("hello", "HI", "No", "ok", "RE: Hello", "RE:   How     is work", 
 "RE: What time are"), class = "factor")), class = "data.frame",       row.names = c(NA, 
 -7L))

我試過這個：

   df %>% 
   filter(Subject!= %RE:)

我不知道如何制定代碼，以便僅當是行中的第一個實例時才會排除。

Answer 1

你可以使用：

subset(df, !grepl('^RE', Subject))

或者使用grep和invert = TRUE

df[grep('^RE', df$Subject, invert = TRUE), , drop = FALSE]

同樣可以在dplyr實現

library(dplyr)
df %>% filter(!grepl('^RE', Subject))

和slice和grep

df %>% slice(grep('^RE', Subject, invert = TRUE))

Answer 2

另一種解決方案

library(stringr)
library(tidyverse)
df %>% 
  filter(str_detect(Subject, pattern = "^[RE]", negate = T))

如何在出現此值的第一個實例的行中排除所有值？ (R Dplyr)

問題描述

2 個解決方案

解決方案1
2 已采納 2020-02-04 02:27:30

解決方案2
0 2020-02-04 10:09:14

如何在出現此值的第一個實例的行中排除所有值？ (R Dplyr)

問題描述

2 個解決方案

解決方案1 2 已采納 2020-02-04 02:27:30

解決方案2 0 2020-02-04 10:09:14

解決方案1
2 已采納 2020-02-04 02:27:30

解決方案2
0 2020-02-04 10:09:14