簡體   English   中英

grepl在R中:盡管單詞內有破折號,但仍存在虛假匹配

[英]grepl in R: spurious match despite intra-word dash

下面是一個最小的可復制示例:

v=c("\\<skill-saw\\>","\\<saw blade\\>")
text="xx placed his hand beneath skill-saw blade"
sapply(v,grepl,text)

最后一條命令返回c(TRUE,TRUE),而我期望的是c(TRUE,FALSE)。 關於如何實現這一點的任何想法? 這個想法是,應該檢測到文本中存在關鍵字“ skill-saw”,而不是關鍵字“ saw blade”。

在此先感謝您的幫助!

您可以嘗試regex

v <- c('(?<= )\\bskill-saw\\b', '(?<= )\\bsaw blade\\b')
 unname(sapply(v, grepl, text, perl=TRUE))
 #[1]  TRUE FALSE

更新

根據新的“文字”,可能是

text1 <- "xx placed his hand beneath skill saw-blade"

v <- c('(?<= )\\bskill-saw\\b', '(?<= )\\bsaw-?blade\\b')
unname(sapply(v, grepl, text1, perl=TRUE))
#[1] FALSE  TRUE

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM