如何檢查包含在長字符串變量中的數據幀中的子字符串？

Question

我的問題是一種不同的方式，因為我們通常使用str.contains()檢查字符串。 我想檢查數據框中的子字符串是否包含在長字符串變量中。

數據框如下所示：

帳戶	子串	類別
1001	現金支付	類別 #1
1002	信用卡支付	類別#2

長字符串變量是long_str = “Cash Payment by Customer” 。

因此，當使用.loc搜索/過濾包含在 long_str 中的子字符串的數據幀中的記錄時，是否有類似str.contains()類似函數，但方式相反？

下面是我想嘗試過濾數據str.contains()的代碼，除了str.contains()不起作用。 謝謝！

df.loc[df['Substring'].str.contains(long_str)]

Answer 1

您可以簡單地使用pandas.Series.apply方法：

>>> long_str = "Cash Payment by Customer"
>>> df.loc[df.Substring.apply(lambda x: x in long_str)]
   Account     Substring     Category
0     1001  Cash Payment  Category #1

如何檢查包含在長字符串變量中的數據幀中的子字符串？

問題描述

1 個解決方案

解決方案1
1 已采納 2021-06-17 14:55:41

如何檢查包含在長字符串變量中的數據幀中的子字符串？

問題描述

1 個解決方案

解決方案1 1 已采納 2021-06-17 14:55:41

解決方案1
1 已采納 2021-06-17 14:55:41