[英]Extracting string inbetween two string patterns in R
如果我有一个字符向量:
links <- c("http://fdsfdsfdsfsdaaa.com/t5/this/bd-p/fdsfsdfdsfscshdad/dasd",
"http://ffdsfdddddfdf.com/t5/that/bd-p/fdsfdsfsddfjfsd")
我想提取“this”和“that”,知道它们介于“t5”和“bd-p”之间。 完全输在了这一点上。
使用sub
:
sub(".*t5/(.*)/bd-p.*","\\1",links)
[1] "this" "that"
尝试这个:
lapply(regmatches(links, regexec("t5/(.*)/bd-p", links)), '[', 2)
[[1]]
[1] "this"
[[2]]
[1] "that"
regexec
与regexec
结合有regmatches
获取子表达式(即括号中的内容)。 regmatches
将返回整个搜索字符串和子表达式,这就是为什么我只提取第二个元素,即子表达式。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.