从字符串中提取匹配模式

Question

我的数据：

d1 <- "GET /api/dir/100%ABC/user/prints/abcd1111/file"
d2 <- "GET /api/dir/100%ABC/prints/efgh1111/file"

我想从我的数据中提取字符串： user/prints或prints part。 我知道如何提取2个特定的字符串，如：

str_extract(d1, "(?<=/dir/)(.*)(?=%ABC)")

获得数字100 。

如何在%ABC/之后提取并以prints结束（包含prints ），这样我就可以得到： user/prints或从同一个脚本prints 。

Answer 1

不完全优雅，但这应该做：

paste0(str_extract(d1, "(?<=%ABC)(.*)(?=prints)"),"prints")
# [1] "/user/prints"
paste0(str_extract(d2, "(?<=%ABC)(.*)(?=prints)"),"prints")
# [1] "/prints"

Answer 2

在基数R中，我们可以使用sub来提取"%ABC"之后的所有内容，直到"prints" 。

sub(".*%ABC/(.*prints).*", "\\1", d1)
#[1] "user/prints"

sub(".*%ABC/(.*prints).*", "\\1", d2)
#[1] "prints"

Answer 3

我们可以使用base R gsub

gsub(".*ABC/|/\\w+/\\w+$", "", d1)
#[1] "user/prints"
gsub(".*ABC/|/\\w+/\\w+$", "", d2)
#[1] "prints"

从字符串中提取匹配模式

问题描述

3 个解决方案

解决方案1
2 2019-08-06 01:06:40

解决方案2
2 已采纳 2019-08-06 01:33:04

解决方案3
1 2019-08-06 03:01:48

从字符串中提取匹配模式

问题描述

3 个解决方案

解决方案1 2 2019-08-06 01:06:40

解决方案2 2 已采纳 2019-08-06 01:33:04

解决方案3 1 2019-08-06 03:01:48

解决方案1
2 2019-08-06 01:06:40

解决方案2
2 已采纳 2019-08-06 01:33:04

解决方案3
1 2019-08-06 03:01:48