如何编写正则表达式从这些URL中提取数字？

Question

我正在尝试编写一个正则表达式来匹配这些URL中的数字（ 12345678和1234567890 ）。

http://www.example.com/p/12345678
http://www.example.com/p/12345678?foo=bar
http://www.example.com/p/some-text-123/1234567890?foo=bar

规则：

数字总是在斜线后出现
数字可以是不同的长度
正则表达式必须检查URL中是否有/p/
数字可能位于URL的末尾，或者可能在它们之后有变量

我的尝试：

\/p\/([0-9]+)

这匹配第一和第二，但不是第三。 所以我尝试过：

\/p\/[^\/?]*\/?([0-9]+)

没有快乐。

REGEX 101

Answer 1

正则表达式可能不适合这项工作。 看起来在每种情况下，使用URL解析器拆分URL会更有意义。 从您的示例中可以看出，数字部分始终是URL路径部分中的最后一项。 我不确定您使用的是哪种语言，但是许多语言都提供了可以将URL解析为其组成部分的功能。

$path = parse_url($url, PHP_URL_PATH);
if(strpos($path, "/p/") === 0) {
    $base = basename($path);
} else {
    // error
}

每次都有效，假设$ url是您正在解析的字符串。

Answer 2

我扩展了你的版本，它现在适用于所有的例子：

\/p\/(.+\/)*(\d+)(\?.+=.+(&.+=.+)*)?$

如果您不关心URL是否有效，则可以将正则表达式缩小为：

\/p\/(.+\/)*(\d+)($|\?)

https://regex101.com/r/pW5qB3/2

Answer 3

如果我理解得很好，你想要的数字只能是：

在URL的最后一次斜杠之后
不能成为变量的一部分，即/p/123?foo=bar456匹配123和
/p/foobar?foo=bar456什么都不匹配

然后，您可以使用以下正则表达式：

(?=/p/).*/\K\d+

说明

(?=/p/)  # lookahead: check '/p/' is in the URL
.*/      # go to the last '/' thanks to greediness
\K       # leave everything we have so far out of the final match
\d+      # select the digits just after the last '/'

为避免转义正斜杠，请不要将它们用作正则表达式分隔符： #(?=/p/).*/\\K\\d+#将正常运行。

在这里看演示。

Answer 4

\/p\/(?:.*\/)?(\d+)\b

你可以尝试这个。这将根据你的密码捕获整数。参见demo.Grab捕获或组。

https://regex101.com/r/dU7oN5/29

$re = "/\\/p\\/(?:.*\\/)?(\\d+)\\b/";
$str = "http://www.example.com/p/12345678\nhttp://www.example.com/p/12345678?foo=bar\nhttp://www.example.com/p/some-text-123/1234567890?foo=bar";

preg_match_all($re, $str, $matches);

Answer 5

var regex = new Regex(@"/(?<ticket>\d+)");

var subject = "http://www.example.com/p/some-text-123/1234567890?foo=bar";

var ticket = regex.Match(subject).Groups["ticket"].Value;

产量：1234567890

如何编写正则表达式从这些URL中提取数字？

问题描述

5 个解决方案

解决方案1
2 已采纳 2014-12-26 20:18:13

解决方案2
1 2014-12-26 20:18:46

解决方案3
0 2014-12-26 20:47:36

解决方案4
0 2014-12-27 04:54:53

解决方案5
-2 2014-12-26 20:20:33

如何编写正则表达式从这些URL中提取数字？

问题描述

5 个解决方案

解决方案1 2 已采纳 2014-12-26 20:18:13

解决方案2 1 2014-12-26 20:18:46

解决方案3 0 2014-12-26 20:47:36

解决方案4 0 2014-12-27 04:54:53

解决方案5 -2 2014-12-26 20:20:33

解决方案1
2 已采纳 2014-12-26 20:18:13

解决方案2
1 2014-12-26 20:18:46

解决方案3
0 2014-12-26 20:47:36

解决方案4
0 2014-12-27 04:54:53

解决方案5
-2 2014-12-26 20:20:33