![](/img/trans.png)
[英]How do you simplify .str.contains code with multiple contains variables?
[英]Python - How do you add \ and | to str.contains()
我正在清理熊猫数据框中的一列,以摆脱包含某些字符的垃圾用户名。 这是示例:
d = {'username': ["11111", "222!22", "21212!", "85511$", "8552$", "115522@@"]}
df = pd.DataFrame(data=d)
username
0 11111
1 222!22
2 21212!
3 85511$
4 8552$
5 115522@@
....
我正在使用以下内容,并且按预期方式工作:
df[~df['username'].str.contains('~|`|!|@|#|\$|%|\^|&|\*|\(|\)|-|_|\+|=|{|\[|}|]|:|;|"|\'|<|,|>|\.|/|\?')]
但我想再添加两个字符:
\\
和|
当我尝试为\\
和\\|
添加这些像\\\\
为|
但我收到错误。 我应该怎么做?
尝试在字符串前添加r
,这样Python会将字符串解释为原始字符串:
df[~df['username'].str.contains(r'~|`|!|@|#|\$|%|\^|&|\*|\(|\)|-|_|\+|=|{|\[|}|]|:|;|"|\'|<|,|>|\.|/|\?')]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.