[英]regex for repeating words in a string to repalce one in Python
如何僅用一個副本替換字符串中的重復單詞?
例如:
hi hi hello hello hello bye bye bye bye
應該變成:
hi hello bye
我的代碼:
import re
s = "hi hi hello hello hello bye bye bye bye"
m=re.sub(r'(?<!\S)((\S+)(?:\s+\2))(?:\s+\2)+(?!\S)', r'\2', s)
print m
輸出:
hi hi hello bye
您可以使用:
re.sub(r'\b(\S+)(?: \1)+\b', r'\1', s)
\\b
轉義符是一個零寬度的匹配符,用於斷字(空格或文本的開頭或結尾)。 使用它可以使模式的其余部分正常工作,而不會像goodbye bye
或foo foobar
被錯誤地修剪。
模式的內部與一個單詞匹配,后跟一個或多個相同單詞的重復,並用空格分隔。 整個單詞被單詞的一個副本代替。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.