繁体   English   中英

regex用于在字符串中重复单词以替换Python中的单词

[英]regex for repeating words in a string to repalce one in Python

如何仅用一个副本替换字符串中的重复单词?

例如:

hi hi hello hello hello bye bye bye bye 

应该变成:

hi hello bye 

我的代码:

import re
s = "hi hi hello hello hello bye bye bye bye"
m=re.sub(r'(?<!\S)((\S+)(?:\s+\2))(?:\s+\2)+(?!\S)', r'\2', s)
print m

输出:

hi hi hello bye

您可以使用:

re.sub(r'\b(\S+)(?: \1)+\b', r'\1', s)

\\b转义符是一个零宽度的匹配符,用于断字(空格或文本的开头或结尾)。 使用它可以使模式的其余部分正常工作,而不会像goodbye byefoo foobar被错误地修剪。

模式的内部与一个单词匹配,后跟一个或多个相同单词的重复,并用空格分隔。 整个单词被单词的一个副本代替。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM