python正则表达式模式提取两个字符之间的值

Question

我试图以url的形式从URL中提取id号

http://www.domain.com/some-slug-here/person/237570
http://www.domain.com/person/237570

这些网址中的任何一个也可以在它们上面有参数

http://www.domain.com/some-slug-here/person/237570?q=some+search+string
http://www.domain.com/person/237570?q=some+search+string

我已经尝试了以下表达式从上面的网址中捕获'237570'的id值，但是每一个都有效，但确实可以在所有四个url场景中工作。

(?<=person\/)(.*)(?=\?)
(?<=person\/)(.*)(?=\?|\z)
(?<=person\/)(.*)(?=\??*)

我所看到的是它正在获得237570，但包括？ 和在网址后面的字符。 当你点击？，/或字符串的结尾时，我怎么能说停止捕获？

Answer 1

串：

http://www.domain.com/some-slug-here/person/1234?q=some+search+string
http://www.domain.com/person/3456?q=some+search+string
http://www.domain.com/some-slug-here/person/5678
http://www.domain.com/person/7890

正则表达式：

person\/(\d{1,})

输出：

>>> regex.findall(string)
[u'1234', u'3456', u'5678', u'7890']

Answer 2

不要使用.*来匹配ID。 . 将匹配任何字符（换行符除外，除非您使用DOTALL选项）。 只需匹配一堆数字： (.*) - > (\\d+)

python正则表达式模式提取两个字符之间的值

问题描述

2 个解决方案

解决方案1
2 已采纳 2012-10-04 00:32:48

解决方案2
1 2012-10-03 23:54:18

python正则表达式模式提取两个字符之间的值

问题描述

2 个解决方案

解决方案1 2 已采纳 2012-10-04 00:32:48

解决方案2 1 2012-10-03 23:54:18

解决方案1
2 已采纳 2012-10-04 00:32:48

解决方案2
1 2012-10-03 23:54:18