簡體   English   中英

如何在 pandas 中使用 str.contains 查找多個字符串

[英]How to find multiple strings with str.contains in pandas

我試圖找出在數據集的名為 hashtags 的列中具有“cov”的所有行。 我也想找到包含“電暈”的行。 如何在 str.contains() 中添加附加參數?

df=df[df["hashtags"].str.contains("cov",case=False)]     #wanted to add "corona" too as a parameter

df=df[text]

我嘗試使用 OR operator(|) 但它顯示錯誤。

df=df[df.hash_tags.str.contains('cov|corona',na=False)]

na=False 表示 nan 值(如果存在)將被評估為 false

以下是 OR 運算符如何與 Pandas 中的 dataframe 掩碼一起使用:

df = df[
        (df['hash_tags'].str.contains('cov')) | 
        (df['hash_tags'].str.contains('corona'))
]

您可以使用單個正則表達式:

df = df[df['hash_tags'].str.contains('cov|corona', regex=True, case=False)]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM