Python正則表達式搜索中間非字母字符的單詞

Question

我需要找到索引，在該索引處，字符串中出現帶字母az的小寫單詞。 但是，字符串中可能包含一堆非字母字符。

例如，單詞“dont”跨越短語“do not do that”中的索引[0,5]。

我搜索了匹配非字母字符的方法，並使用以下正則表達式實現了這一點：

>>> import re
>>> pattern = re.compile("d[^a-z]*o[^a-z]*n[^a-z]*t[^a-z]*")
>>> test = "don't"
>>> pattern.search(test).start()
0
>>> pattern.search(test).end()
5
>>> test = "d'o&&&&&n't"
>>> pattern.search(test).start()
0
>>> pattern.search(test).end()
11
>>>

是否有更簡潔的方式來表達這個正則表達式？ 或者我是否必須編寫代碼以在我要搜索的每個單詞中的每個字符之間插入[^ az] *？

對不起，如果這個問題已經存在 - 我不知道如何用這個問題說出來。 謝謝您的幫助。

Answer 1

您可以匹配每個小寫單詞，使用非捕獲組下的重復：

(?:[a-z][^a-z]*)+

或者，您可以為每個給定的單詞自動化此正則表達式：

>>> word = 'dont'
>>> regex = ''.join(x + '[^a-z]*' for x in word)
>>> regex
'd[^a-z]*o[^a-z]*n[^a-z]*t[^a-z]*'

Answer 2

是的，如果真的是你的意圖，你必須按照你展示的方式去做。

正則表達式僅匹配特定字符或字符類型的后續序列。 它不能知道你需要將d&&o與d和o匹配，因為還有其他的chars必須匹配。

Answer 3

嘗試這個：

pattern = re.compile("[^\w']|don't")

Python正則表達式搜索中間非字母字符的單詞

問題描述

3 個解決方案

解決方案1
2 已采納 2017-05-31 20:52:56

解決方案2
1 2017-05-31 21:14:33

解決方案3
0 2017-05-31 20:54:03

Python正則表達式搜索中間非字母字符的單詞

問題描述

3 個解決方案

解決方案1 2 已采納 2017-05-31 20:52:56

解決方案2 1 2017-05-31 21:14:33

解決方案3 0 2017-05-31 20:54:03

解決方案1
2 已采納 2017-05-31 20:52:56

解決方案2
1 2017-05-31 21:14:33

解決方案3
0 2017-05-31 20:54:03