正则表达式查找附近位置多次出现相同字符串的单词

Question

我正在尝试使用正则表达式查找类似以下的单词。 但是，我找不到将字母与相同字母区分开的想法。

例如：

text = ' I am sooo hungryyyy....Grrrh ...... helppp meeeeee '
pattern = re.compile(r"(.)\1{1,}", re.DOTALL)

这种模式不是那么有用。 不知道为什么。 我想要一个正则表达式匹配所有单词，例如sooo ， hungryyyy ， Grrrh .... 这意味着，如果一个字母同时重复或相邻重复至少2次。

Answer 1

如果您想将非空白与连续字符进行匹配，可以执行以下操作：

>>> import re
>>> text = 'I am sooo hungryyyy....Grrrh ...... helppp meeeeee'
>>> matches = re.findall(r'(\S*?(.)\2+\S*?)', text)
>>> [x[0] for x in matches]
['sooo', 'hungryyyy', '....', 'Grrr', '......', 'helppp', 'meeeeee']

这意味着，如果一个字母同时重复或彼此重复至少2次...

但是，如果您要查找文字字符，则您的模式将简单地更改：

>>> matches = re.findall(r'(\w*(\w)\2\w*)', text)
>>> [x[0] for x in matches]
['sooo', 'hungryyyy', 'Grrrh', 'helppp', 'meeeeee']

Answer 2

import re
text = ' I am sooo hungryyyy....Grrrh ...... helppp meeeeee '
for p in re.findall(r'(\w*(\w)\2\w*)', text):
    print p

得到：

('sooo', 'o')
('hungryyyy', 'y')
('Grrrh', 'r')
('helppp', 'p')
('meeeeee', 'e')

正则表达式查找附近位置多次出现相同字符串的单词

问题描述

2 个解决方案

解决方案1
2 2015-05-16 03:37:10

解决方案2
0 2015-05-16 03:55:12

正则表达式查找附近位置多次出现相同字符串的单词

问题描述

2 个解决方案

解决方案1 2 2015-05-16 03:37:10

解决方案2 0 2015-05-16 03:55:12

解决方案1
2 2015-05-16 03:37:10

解决方案2
0 2015-05-16 03:55:12