從R中的字符串中間提取連續的單詞

Question

好的，所以我是 regexpr 的新手，我的大腦快要炸了。 我想做的是從字符串中提取單詞二和三。 例如：

sentence <- "Certified 2017 Mazda CX-5 AWD Touring"
TheFunction(sentence)

應該返回“2017 Mazda”

我最初的嘗試是使用類似的東西：

sub("\\s\\S+\\s\\S+\\s", "\\1", sentence)

但正在慘敗。 我的想法是找到匹配“space-word-space-word-space”的第一個模式

Answer 1

您可以使用 strsplit 然后將第二個和第三個單詞粘貼在一起

paste(strsplit(sentence, split = '\\s')[[1]][2:3], collapse = " ")