繁体   English   中英

如何删除字符串中重复两次以上的字符?

[英]How to remove characters which repeat more than twice in a string?

例如,我想删除喜欢重复的字符hhhaaappyhhaappy因为ha重复两次。 我想删除重复两次以上的所有字符。 如何在python中快速实现它?

此外,是否有任何python模块可以纠正这个词? 喜欢正确的hhhaaappy happy

你可以使用itertools.groupby

import itertools
s = "hhhaaappy"
new_s = [(a, list(b)) for a, b in itertools.groupby(s)]
final_s = ''.join(''.join(b[:-1]) if len(b) > 2 else ''.join(b) for a, b in new_s)

输出:

'hhaappy'

我认为分享这个会很酷。 模块称为自动更正

它通过使用候选模型 ,通过对单词执行“简单编辑”来工作。 例如,它处理“ 删除 - >删除字母 ”,“ 转置 - >交换两个相邻字母 ”,“ 替换 - >将一个字母更改为另一个字母 ”,“ 插入 - >添加字母 ”。

因此, hhhaaappy可能不起作用,但是hhapyhhapppy可以工作。

>>> from autocorrect import spell
>>> spell('hhhaaappy')
'hhhaaappy'
>>> spell('hhapy')
'shapy'
>>> spell('happpy')
'happy'
>>> spell('hhapppy')
'happy'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM