簡體   English   中英

regex用於在字符串中重復單詞以替換Python中的單詞

[英]regex for repeating words in a string to repalce one in Python

如何僅用一個副本替換字符串中的重復單詞?

例如:

hi hi hello hello hello bye bye bye bye 

應該變成:

hi hello bye 

我的代碼:

import re
s = "hi hi hello hello hello bye bye bye bye"
m=re.sub(r'(?<!\S)((\S+)(?:\s+\2))(?:\s+\2)+(?!\S)', r'\2', s)
print m

輸出:

hi hi hello bye

您可以使用:

re.sub(r'\b(\S+)(?: \1)+\b', r'\1', s)

\\b轉義符是一個零寬度的匹配符,用於斷字(空格或文本的開頭或結尾)。 使用它可以使模式的其余部分正常工作,而不會像goodbye byefoo foobar被錯誤地修剪。

模式的內部與一個單詞匹配,后跟一個或多個相同單詞的重復,並用空格分隔。 整個單詞被單詞的一個副本代替。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM