簡體   English   中英

在 R 中,如何使用正則表達式逐行比較兩列中的模式和不匹配行?

[英]In R, how do I compare for pattern and mismatched rows from two columns with a regex, row-by row?

使用下面的代碼,我設法獲得了匹配的行,但我怎樣才能獲得不匹配的行?

ABData <- data.frame(a = c(1,2,3,4,5),b = c("London", "Oxford", "Berlin","Hamburg", "Oslo"),c = c("Hello London","No London","asdBerlin","No Match","OsLondonlohama"))

match<- ABData %>% rowwise() %>% filter(grepl(b,c))

比賽結果:

ab c
1 1 London Hello London 2 3 Berlin asdBerlin

除了匹配行,我還想要不匹配的行

幫助我獲得不匹配的行。 提前致謝。

我認為這可能會有所幫助:

library(tidyverse)
ABData <- data.frame(a = c(1,2,3,4,5),
                     b = c("London", "Oxford", "Berlin","Hamburg", "Oslo"),
                     c = c("Hello London","No London","asdBerlin","No Match","OsLondonlohama"))

match <- ABData %>% 
  rowwise() %>% 
  filter_at(.vars= vars(c), all_vars(grepl(b,.)))
match
#> Source: local data frame [2 x 3]
#> Groups: <by row>
#> 
#> # A tibble: 2 x 3
#>       a b      c           
#>   <dbl> <chr>  <chr>       
#> 1     1 London Hello London
#> 2     3 Berlin asdBerlin

no_match <- ABData %>% 
  rowwise() %>% 
  filter_at(.vars= vars(c), all_vars(!grepl(b,.)))
no_match
#> Source: local data frame [3 x 3]
#> Groups: <by row>
#> 
#> # A tibble: 3 x 3
#>       a b       c             
#>   <dbl> <chr>   <chr>         
#> 1     2 Oxford  No London     
#> 2     4 Hamburg No Match      
#> 3     5 Oslo    OsLondonlohama

代表 package (v0.3.0) 於 2020 年 6 月 3 日創建

您可以使用str_detect中的stringr ,它在字符串和模式上進行矢量化,這樣您就不必使用rowwise

subset(ABData, !stringr::str_detect(c, b))

#  a       b              c
#2 2  Oxford      No London
#4 4 Hamburg       No Match
#5 5    Oslo OsLondonlohama

如果您想將它與dplyr一起使用:

library(dplyr)
ABData %>% filter(!stringr::str_detect(c, b))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM