使用 re.findall 提取 URL 末尾的 id

Question

sfdc_url= 'https://unify.my.salesforce.com/a0n82000006VlNaPPP'

sfdc_partnerid= re.findall(r'https://unify.my.salesforce.com/(.*?)?sr',sfdc_url)

我希望 sfdc_partnerid 返回“a0n82000006VlNaPPP”

我一直得到一个空的 [] 结果。

Answer 1

鉴于您的网址，正确的正则表达式将是：

sfdc_url= 'https://unify.my.salesforce.com/a0n82000006VlNaPPP'
sfdc_partnerid = re.findall(r'https://unify.my.salesforce.com/(.*)', sfdc_url)
print sfdc_partnerid

也可以在https://eval.in/1078060上查看

它是关于量词的： *? 是一个惰性量词，匹配尽可能少的字符

(.*?)实际上意味着“尽可能少地匹配零和无限之间的任何内容”，它是空的。

添加一个? 之后，表示“前一个匹配项中的零个或一个”，因此： (.*?)? 有效地意味着“零或一无所有”

我不确定原始正则表达式中剩余的sr

Answer 2

如果你在 python3 上，你也可以看看urllib.parse

例如

from urllib import urlparse
result = urlparse("https://unify.my.salesforce.com/a0n82000006VlNaPPP")
result.path

使用 re.findall 提取 URL 末尾的 id

问题描述

2 个解决方案

解决方案1
0 已采纳 2019-01-16 22:40:38

解决方案2
0 2019-01-17 02:16:07

使用 re.findall 提取 URL 末尾的 id

问题描述

2 个解决方案

解决方案1 0 已采纳 2019-01-16 22:40:38

解决方案2 0 2019-01-17 02:16:07

解决方案1
0 已采纳 2019-01-16 22:40:38

解决方案2
0 2019-01-17 02:16:07