用於查找文本的正則表達式

Question

我想獲得緊跟在AB.00.000的My Text Content 。

我可以通過使用下面的正則表達式得到這個AB.00.000 ，

([A-Z]{2,3}\.[0-9]{2}\.[0-9]{3})

如何在 Python 中獲取AB.00.000旁邊的文本？

這是輸入字符串：

Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry's standard 

AB.00.000 My Text Content

$!#"!

23:50

My Phone

Answer 1

在找到您的模式后，您似乎想獲得該行的其余部分。

您可以使用

r'\b[A-Z]{2,3}\.[0-9]{2}\.[0-9]{3}\b\s*(.*)'

請參閱正則表達式演示。 請注意， \\b是一個單詞邊界，它需要在單詞 char（或字符串的開頭/結尾）之前或之后的字母/數字/ _以外的字符。 \\s*(.*)是您的解決方案嚴重缺失的內容：

\\s* - 0+ 個空格
(.*) - 捕獲組 #1：除換行符以外的任何 0 個或更多字符，盡可能多，即行的其余部分。

如果模式必須位於一行的開頭，則提取所需文本的正則表達式方式將如下所示

r'(?m)^[A-Z]{2,3}\.[0-9]{2}\.[0-9]{3}\b\s*(.*)'

請參閱另一個正則表達式演示。 (?m) (= re.M選項) 使^匹配一行的開始，而不僅僅是整個字符串的開始，位置。

Python：

m = re.search(r'\b[A-Z]{2,3}\.[0-9]{2}\.[0-9]{3}\b\s*(.*)')
if m:
    print(m.group(1))

請注意，要訪問匹配的第一個（也是唯一的）括號部分，您需要通過.group(1)訪問匹配組。

用於查找文本的正則表達式

問題描述

1 個解決方案

解決方案1
1 已采納 2019-07-04 08:27:54

用於查找文本的正則表達式

問題描述

1 個解決方案

解決方案1 1 已采納 2019-07-04 08:27:54

解決方案1
1 已采納 2019-07-04 08:27:54