如何用re.split（）分割所有特殊字符

Question

我試圖使用import re package中的re.split()分割任何特殊字符。 這是我到目前為止所做的，但似乎還沒有真正解決。 有任何想法嗎？

word = [b for b in re.split(r'\`\-\=\~\!\@\#\$\%\^\&\*\(\)\_\+\[\]\{\}\;\'\\\:\"\|\<\,\.\/\>\<\>\?', a)]

Answer 1

可以更容易地創建一個不使用^字符拆分和反轉它的字符類，而不是枚舉所有“特殊”字符。

例如， re.split(r"[^\\w\\s]", s)將分割為不在類\\w或\\s中的任何字符（ [a-zA-Z0-9_]和[ \\t\\n\\r\\f\\v] [a-zA-Z0-9_] [ \\t\\n\\r\\f\\v]分別見此處以獲取更多信息）。 但是，請注意_字符包含在\\w類中，因此您可能希望明確指定所有“常規”字符，例如re.split(r"[^a-zA-Z0-9\\s]", s) 。

>>> re.split(r"[^a-zA-Z0-9\s]", "foo bar_blub23/x~y'z")
['foo bar', 'blub23', 'x', 'y', 'z']

Answer 2

使用字符類：

re.split(r'[`\-=~!@#$%^&*()_+\[\]{};\'\\:"|<,./<>?]', a)

Answer 3

當您遇到不是字母數字的字符時，您可能希望拆分字符串。 為此，您可以在正則表達式中使用元字符\\w ，這意味着“每個字母a-ZA-Z0-9”並與^相反，如下所示：

>>> re.split(r'[^\w]', 'toto"t"o/t!')
['toto', 't', 'o', 't', '']

如何用re.split（）分割所有特殊字符

問題描述

3 個解決方案

解決方案1
11 2014-01-09 15:29:15

解決方案2
8 已采納 2014-01-09 15:12:28

解決方案3
3 2014-01-09 15:31:28

如何用re.split（）分割所有特殊字符

問題描述

3 個解決方案

解決方案1 11 2014-01-09 15:29:15

解決方案2 8 已采納 2014-01-09 15:12:28

解決方案3 3 2014-01-09 15:31:28

解決方案1
11 2014-01-09 15:29:15

解決方案2
8 已采納 2014-01-09 15:12:28

解決方案3
3 2014-01-09 15:31:28