Python正則表達式搜索並替換字符串后的所有字符

Question

我正在嘗試做一些我認為很簡單的事情，但是我在使用正則表達式時遇到了一些麻煩。 具體來說，我想在同一行上找到CAUGHT AN ERROR及其后的所有內容，並將其替換為CAUGHT AN ERROR: XXXXX .. 我的理解是使用.*$ ( example ) 將允許我搜索到最后行，但我沒有使用 for 循環獲得准確的替換。 如何在我搜索的字符后替換所有內容？

1970-01-01 10:59:02     
1970-01-01 10:59:02    
1970-01-01 10:59:01    CAUGHT AN ERROR: rmv: cannot remove '/media/^Red^XXXXXX.jpg': No such file or directory; FROM: exec rm [file join $drive $newFile] (in USB::Write /)
1970-01-01 10:59:01    CAUGHT AN ERROR: rmv: cannot remove '/media/^Green^XXXXXX.jpg': No such file or directory; FROM: exec rm [file join $drive $newFile] (in USB::Write /media/ug)
1970-01-01 10:59:02    CAUGHT AN ERROR: rmv: cannot remove '/media/^Blue^XXXXXX.jpg': No such file or directory; FROM: exec rm [file join $drive $newFile] (in USB::Write /medi0349223^BradbuXXXXXX.jpg)
1970-01-01 10:59:02    CAUGHT AN ERROR: rmv: cannot remove '/media/^XXXXXX.jpg': No such file or directory; FROM: exec rm [file join $drive $newFile] (in USB::Write /media/usb0 XXXXXX.jpg)
1970-01-01 10:59:02    CAUGHT AN ERROR: rmv: cannot remove '/media/^Orange^XXXXXX.jpg': No such file or directory; FROM: exec rm [file join $drive $newFile] (in USB::Write )
1970-01-01 10:59:02

我將上面的示例日志保存在一個文件中，然后執行以下代碼：

with open(r'C:\Users\Downloads\LOG\sample.log', mode='r', encoding='utf8') as log_r:
    content = log_r.read()

dict_items = {r'CAUGHT AN ERROR: [A-Z|a-z|0-9|\.|\-|\,|\_|\{|\}|\)|\(|\/]*\+': r'CAUGHT AN ERROR: XXXXXX'}

for k, v in dict_items.items():
    content = re.sub(k, v, content)

print(content)

在我的字典里，我也嘗試過，但無濟於事。

r'CAUGHT AN ERROR: .\$'
r'CAUGHT AN ERROR: .*$'

預期結果

1970-01-01 10:59:02     
1970-01-01 10:59:02    
1970-01-01 10:59:01    CAUGHT AN ERROR: XXXXXX
1970-01-01 10:59:01    CAUGHT AN ERROR: XXXXXX
1970-01-01 10:59:02    CAUGHT AN ERROR: XXXXXX
1970-01-01 10:59:02    CAUGHT AN ERROR: XXXXXX
1970-01-01 10:59:02    CAUGHT AN ERROR: XXXXXX
1970-01-01 10:59:02

Answer 1

r'CAUGHT AN ERROR: .*$'是正確r'CAUGHT AN ERROR: .*$'正則表達式。 但是您需要使用re.MULTILINE標志，以便$將匹配行的結尾，而不是整個字符串的結尾。

dict_items = {r'CAUGHT AN ERROR: .*$': r'CAUGHT AN ERROR: XXXXXX'}
for k, v in dict_items.items():
    content = re.sub(k, v, content, flags=re.MULTILINE)

print(content)

演示

Python正則表達式搜索並替換字符串后的所有字符

問題描述

1 個解決方案

解決方案1
0 已采納 2020-03-18 21:47:27

Python正則表達式搜索並替換字符串后的所有字符

問題描述

1 個解決方案

解決方案1 0 已采納 2020-03-18 21:47:27

解決方案1
0 已采納 2020-03-18 21:47:27