使用re.match提取網址格式的部分

Question

在的NodeJS，我使用正則表達式來提取下的子部分tenant在這個網址， http://myServer:8000/api/running/tenant/sk/services 。 sk可以正確打印。

代碼是

var re = /(?:[\w\W]+)\/tenant\/([\w]+?)\/(?:[\w\W]*)/
var results = re.exec('http://myServer:8000/api/running/tenant/sk/services')
console.log(results[1])

我將代碼移至python，

import re
m = re.match(r"(?:\w\W+)tenant/(\w+)/(?:[\w\W]*)", "http://myServer:8000/api/running/tenant/sk/services")
m.group(1)

它拋出AttributeError: 'NoneType' object has no attribute 'group'

為什么它不匹配tenant后面的一個單詞？

Answer 1

findall /搜索應該可以幫助您

找到所有

>>> m = re.findall(r"(?:\w\W+)tenant/(\w+)/(?:[\w\W]*)", "http://myServer:8000/api/running/tenant/sk/services")
>>> m
['sk']

搜索

>>> m = re.search(r"(?:\w\W+)tenant/(\w+)/(?:[\w\W]*)", "http://myServer:8000/api/running/tenant/sk/services")
>>> m.group(1)
'sk'

匹配失敗的原因是因為它嘗試在字符串重新開始時進行匹配。

re.match（pattern，string，flags = 0）如果字符串開頭的零個或多個字符與正則表達式模式匹配，則返回相應的MatchObject實例。 如果字符串與模式不匹配，則返回None；否則返回false。 請注意，這與零長度匹配不同。

請注意，即使在MULTILINE模式下，re.match（）也只會在字符串的開頭而不是每行的開頭進行匹配。

如果要在字符串中的任意位置找到匹配項，請改用search（）（另請參見search（）vs. match（））。

Answer 2

match不具有group屬性。 嘗試search -

>>>m = re.search(r"(tenant)/(\w+)/(\w+)", "http://myServer:8000/api/running/tenant/sk/services")
>>>m.group(1)
>>>'tenant'
>>>m.group(2)
>>>'sk'
>>>m.group(3)
>>>'services'
>>>m.groups()
>>>('tenant', 'sk', 'services')

或嘗試使用re.split返回常規列表- (?<!\\\\)/(?!=\\\\)表示查找/不具有/之前或之后的-並用它分割文本-

>>>re.split(r"(?<!\\)/(?!=\\)", "http://myServer:8000/api/running/tenant/sk/services")
>>>['http:', '', 'myServer:8000', 'api', 'running', 'tenant', 'sk', 'services']

Answer 3

實際上，在這種情況下，您不需要正則表達式， str.split()就足夠了：

>>> url = 'http://myServer:8000/api/running/tenant/sk/services'
>>> l = url.split('/')
>>> l[l.index('tenant')+1]
'sk'
>>>

使用re.match提取網址格式的部分

問題描述

3 個解決方案

解決方案1
2 已采納 2015-12-13 03:36:20

解決方案2
2 2015-12-13 03:36:43

解決方案3
1 2015-12-13 03:42:57

使用re.match提取網址格式的部分

問題描述

3 個解決方案

解決方案1 2 已采納 2015-12-13 03:36:20

解決方案2 2 2015-12-13 03:36:43

解決方案3 1 2015-12-13 03:42:57

解決方案1
2 已采納 2015-12-13 03:36:20

解決方案2
2 2015-12-13 03:36:43

解決方案3
1 2015-12-13 03:42:57