在 R (REGEX) 中的两个字符之间提取 substring

Question

我无法使用正则表达式从字符串中提取经度和纬度。 字符串是这样的：

[1] "\"42.352800\" data-longitude=\"-71.187500\" \"22\"></div>"

我希望能够分别获得第一个数字“42.352800”和第二个数字“-71.187500”作为两个变量。 因为我将在一堆条目上执行此操作，所以我需要确保它可以获取这些数字，无论它们是正数还是负数。

我想我应该使用正则表达式基本上说：

纬度 <- 从“到”（获取第一个数字）

然后类似的东西得到经度。

这里有什么想法吗？ 我对正则表达式比较陌生。

Answer 1

我同意@r2evans 的观点，如果您从网页上抓取这些信息，例如使用rvest获取数据会简单得多。

要回答您的问题，您可以使用str_match获取前两个数字。

string <- "\"42.352800\" data-longitude=\"-71.187500\" \"22\"></div>"

stringr::str_match(string, '(\\d+\\.\\d+).*?(-?\\d+\\.\\d+)')[, -1]
#[1] "42.352800"  "-71.187500"

在 R (REGEX) 中的两个字符之间提取 substring

问题描述

1 个解决方案

解决方案1
0 已采纳 2020-06-08 01:17:49

在 R (REGEX) 中的两个字符之间提取 substring

问题描述

1 个解决方案

解决方案1 0 已采纳 2020-06-08 01:17:49

解决方案1
0 已采纳 2020-06-08 01:17:49