如何從右邊創建非貪婪的正則表達式？

Question

我有一個名為'ab9c_xy8z_12a3.pdf'的文件。 我想捕獲最后一個下划線之后和'.pdf'之前的部分。 寫正則表達式如：

    s = 'ab9c_xy8z_12a3.pdf'
    m = re.search(r'_.*?\.pdf',s)
    m.group(0)

返回：'_ xin8z_12a3.pdf'

在這個例子中，我想只捕獲'12a3'部分。 謝謝您的幫助。

Answer 1

_.*?\\.pdf正則表達式將第一個下划線與_匹配，然后匹配除換行符之外的任何0 +字符，盡可能少，但最接近最后一個出現的.pdf ，結果最后的字符串。 所以， . 只是因為正則表達式引擎分析字符串（從左到右）的方式，因此匹配所有下划線到.pdf . 圖案。

您可以通過使用否定字符類 [^_]而不是使用來修復模式. 這將“減去”下划線. 圖案。

([^_]+)\.pdf

並獲取Group 1值。 請參閱正則表達式演示。

Python演示：

import re
rx = r"([^_]+)\.pdf"
s = "ab9c_xy8z_12a3.pdf"
m = re.search(rx, s)
if m:
    print(m.group(1)) # => 12a3

Answer 2

請改用re.split ：

>>> re.split('[_.]', 'ab9c_xy8z_12a3.pdf')[-2]
'12a3'

如何從右邊創建非貪婪的正則表達式？

問題描述

2 個解決方案

解決方案1
2 已采納 2018-04-02 20:07:51

解決方案2
1 2018-04-02 18:59:03

如何從右邊創建非貪婪的正則表達式？

問題描述

2 個解決方案

解決方案1 2 已采納 2018-04-02 20:07:51

解決方案2 1 2018-04-02 18:59:03

解決方案1
2 已采納 2018-04-02 20:07:51

解決方案2
1 2018-04-02 18:59:03