簡體   English   中英

過濾 dataframe 以查找不包含列表中任何字母的單詞

[英]Filter dataframe for words which do not contain any of the letters in a list

我正在尋找一種方法來過濾字母列表中的 dataframe。 我希望我的 output dataframe 是原始 dataframe 中的單詞,不包含列表中的任何字母

例如

letter_list = ['a','d','o','m','s']

>>>df

ID     WORD
1     'yellow'
2     'orange'
3     'green'
4     'blue'
5     'red'

>>> expected output

ID     WORD
3     'green'
4     'blue'

我不確定如何 go 關於這個

謝謝你的幫助

Series.str.contains與帶|的連接字母一起使用對於正則表達式or通過匹配值過濾並添加~通過反向掩碼過濾,所以得到不匹配的行:

df = df[~df['WORD'].str.contains('|'.join(letter_list))]
print (df)
   ID     WORD
2   3  'green'
3   4   'blue'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM