[英]How to check a substring in dataframe included in a long string variable?
我的問題是一種不同的方式,因為我們通常使用str.contains()
檢查字符串。 我想檢查數據框中的子字符串是否包含在長字符串變量中。
數據框如下所示:
帳戶 | 子串 | 類別 |
---|---|---|
1001 | 現金支付 | 類別 #1 |
1002 | 信用卡支付 | 類別#2 |
長字符串變量是long_str = “Cash Payment by Customer”
。
因此,當使用.loc
搜索/過濾包含在 long_str 中的子字符串的數據幀中的記錄時,是否有類似str.contains()
類似函數,但方式相反?
下面是我想嘗試過濾數據str.contains()
的代碼,除了str.contains()
不起作用。 謝謝!
df.loc[df['Substring'].str.contains(long_str)]
您可以簡單地使用pandas.Series.apply
方法:
>>> long_str = "Cash Payment by Customer"
>>> df.loc[df.Substring.apply(lambda x: x in long_str)]
Account Substring Category
0 1001 Cash Payment Category #1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.