[英]Filter dataframe for words which do not contain any of the letters in a list
我正在寻找一种方法来过滤字母列表中的 dataframe。 我希望我的 output dataframe 是原始 dataframe 中的单词,不包含列表中的任何字母
例如
letter_list = ['a','d','o','m','s']
>>>df
ID WORD
1 'yellow'
2 'orange'
3 'green'
4 'blue'
5 'red'
>>> expected output
ID WORD
3 'green'
4 'blue'
我不确定如何 go 关于这个
谢谢你的帮助
将Series.str.contains
与带|
的连接字母一起使用对于正则表达式or
通过匹配值过滤并添加~
通过反向掩码过滤,所以得到不匹配的行:
df = df[~df['WORD'].str.contains('|'.join(letter_list))]
print (df)
ID WORD
2 3 'green'
3 4 'blue'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.