繁体   English   中英

在R中的两个字符串模式之间提取字符串

[英]Extracting string inbetween two string patterns in R

如果我有一个字符向量:

 links <- c("http://fdsfdsfdsfsdaaa.com/t5/this/bd-p/fdsfsdfdsfscshdad/dasd",
            "http://ffdsfdddddfdf.com/t5/that/bd-p/fdsfdsfsddfjfsd")

我想提取“this”和“that”,知道它们介于“t5”和“bd-p”之间。 完全输在了这一点上。

使用sub

sub(".*t5/(.*)/bd-p.*","\\1",links)
[1] "this" "that"

尝试这个:

lapply(regmatches(links, regexec("t5/(.*)/bd-p", links)), '[', 2)
[[1]]
[1] "this"

[[2]]
[1] "that"

regexecregexec结合有regmatches获取子表达式(即括号中的内容)。 regmatches将返回整个搜索字符串和子表达式,这就是为什么我只提取第二个元素,即子表达式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM