繁体   English   中英

过滤 dataframe 以查找不包含列表中任何字母的单词

[英]Filter dataframe for words which do not contain any of the letters in a list

我正在寻找一种方法来过滤字母列表中的 dataframe。 我希望我的 output dataframe 是原始 dataframe 中的单词,不包含列表中的任何字母

例如

letter_list = ['a','d','o','m','s']

>>>df

ID     WORD
1     'yellow'
2     'orange'
3     'green'
4     'blue'
5     'red'

>>> expected output

ID     WORD
3     'green'
4     'blue'

我不确定如何 go 关于这个

谢谢你的帮助

Series.str.contains与带|的连接字母一起使用对于正则表达式or通过匹配值过滤并添加~通过反向掩码过滤,所以得到不匹配的行:

df = df[~df['WORD'].str.contains('|'.join(letter_list))]
print (df)
   ID     WORD
2   3  'green'
3   4   'blue'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM