[英]How to find multiple strings with str.contains in pandas
我試圖找出在數據集的名為 hashtags 的列中具有“cov”的所有行。 我也想找到包含“電暈”的行。 如何在 str.contains() 中添加附加參數?
df=df[df["hashtags"].str.contains("cov",case=False)] #wanted to add "corona" too as a parameter
df=df[text]
我嘗試使用 OR operator(|) 但它顯示錯誤。
df=df[df.hash_tags.str.contains('cov|corona',na=False)]
na=False 表示 nan 值(如果存在)將被評估為 false
以下是 OR 運算符如何與 Pandas 中的 dataframe 掩碼一起使用:
df = df[
(df['hash_tags'].str.contains('cov')) |
(df['hash_tags'].str.contains('corona'))
]
您可以使用單個正則表達式:
df = df[df['hash_tags'].str.contains('cov|corona', regex=True, case=False)]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.