[英]Filter dataframe for words which do not contain any of the letters in a list
我正在尋找一種方法來過濾字母列表中的 dataframe。 我希望我的 output dataframe 是原始 dataframe 中的單詞,不包含列表中的任何字母
例如
letter_list = ['a','d','o','m','s']
>>>df
ID WORD
1 'yellow'
2 'orange'
3 'green'
4 'blue'
5 'red'
>>> expected output
ID WORD
3 'green'
4 'blue'
我不確定如何 go 關於這個
謝謝你的幫助
將Series.str.contains
與帶|
的連接字母一起使用對於正則表達式or
通過匹配值過濾並添加~
通過反向掩碼過濾,所以得到不匹配的行:
df = df[~df['WORD'].str.contains('|'.join(letter_list))]
print (df)
ID WORD
2 3 'green'
3 4 'blue'
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.