[英]Extract the consecutive words from the middle of a string in R
好的,所以我是 regexpr 的新手,我的大腦快要炸了。 我想做的是從字符串中提取單詞二和三。 例如:
sentence <- "Certified 2017 Mazda CX-5 AWD Touring"
TheFunction(sentence)
應該返回“2017 Mazda”
我最初的嘗試是使用類似的東西:
sub("\\s\\S+\\s\\S+\\s", "\\1", sentence)
但正在慘敗。 我的想法是找到匹配“space-word-space-word-space”的第一個模式
您可以使用 strsplit 然后將第二個和第三個單詞粘貼在一起
paste(strsplit(sentence, split = '\\s')[[1]][2:3], collapse = " ")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.