[英]Extract the consecutive words from the middle of a string in R
好的,所以我是 regexpr 的新手,我的大脑快要炸了。 我想做的是从字符串中提取单词二和三。 例如:
sentence <- "Certified 2017 Mazda CX-5 AWD Touring"
TheFunction(sentence)
应该返回“2017 Mazda”
我最初的尝试是使用类似的东西:
sub("\\s\\S+\\s\\S+\\s", "\\1", sentence)
但正在惨败。 我的想法是找到匹配“space-word-space-word-space”的第一个模式
您可以使用 strsplit 然后将第二个和第三个单词粘贴在一起
paste(strsplit(sentence, split = '\\s')[[1]][2:3], collapse = " ")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.