正則表達式匹配 url 目錄路徑而不匹配文件名

Question

我想要一個匹配的正則表達式

https://example.com/studio/或https://example.com/studio不匹配https://example.com/studio/path-to-file-blah-blah或https://example.com/studio/path-to-file-blah-blah.html

我嘗試https?:\\/\\/(?:w{3}[.])?example[.]com\\/studio\\S*但它匹配上面的兩個組。

我也試過https?:\\/\\/(?:w{3}[.])?example[.]com\\/studio\\/? 它只能匹配第一組。 但問題是只匹配第二組。 請問我該怎么做？

Answer 1

我假設您需要從非結構化文本中解析 URL。 假設有一個空格字符、換行符或字符串的結尾，以下內容應該適合您。 如果在 URL 之后直接有句點或其他字符，這將失敗，但很容易修改以支持其他終止字符。

https?:\/\/(?:w{3}[.])?example[.]com\/studio\/?(?:\s|$)

(?:\\s|$)只是說匹配一個空格字符（包括行結束行一個新行字符）或匹配字符串的結尾。

正則表達式演示

編輯

我想你說的第 2 組是：

https://example.com/studio/path-to-file-blah-blah
https://example.com/studio/path-to-file-blah-blah.html

要匹配這些，您需要以下正則表達式：

https?:\/\/(?:w{3}[.])?example[.]com\/studio\/\S+

我所做的唯一更改是最后一個字符是\\S* ，但它應該是\\S+ 。

*表示 0 或更多

+表示 1 個或多個。

希望這涉及您正在尋找的內容。 如果我仍然不在，如果你給組貼上標簽，它會幫助我理解，這樣我就可以寫出正確的正則表達式。

Answer 2

進一步擴展 Nathan 的答案，您可以更改 RegEx 的末尾以不捕獲尾隨空格或換行符。 這將匹配前兩種情況：

https?:\/\/(?:w{3}[.])?example[.]com\/studio\/?(?=\s|$)

要僅匹配第二種情況，請使用以下命令：

https?:\/\/(?:w{3}[.])?example[.]com\/studio(?=[^\/])

正則表達式匹配 url 目錄路徑而不匹配文件名

問題描述

2 個解決方案

解決方案1
2 已采納 2016-10-12 01:11:38

解決方案2
0 2016-10-12 01:37:47

正則表達式匹配 url 目錄路徑而不匹配文件名

問題描述

2 個解決方案

解決方案1 2 已采納 2016-10-12 01:11:38

解決方案2 0 2016-10-12 01:37:47

解決方案1
2 已采納 2016-10-12 01:11:38

解決方案2
0 2016-10-12 01:37:47