通過匹配Pandas df中所有列中的子字符串來過濾所有行

Question

我有一個數據框，我希望將與給定子字符串匹配的所有行寫為列表。

df1 = pd.DataFrame({'col1': ["c1", "match", "c3", "c4", "c5", "c6","c7","c8","c9"],  
                'col2': [" ","a1","a2","Smatch6","a4"," ","a8"," ","a7"],  
                   'col3': ["Red", "Ted", "Pet", "match1", "Pmatch", "Rmatchd","sample","agadR","Padgadg"]
                    })

輸出應作為列表放入詞典中

Data_Dictionary ['data'] =此的o / p

嘗試過此代碼，但未返回任何內容

resultdf = df1.filter(like='match', axis=0)

預期結果：resultdf

    col1     col2     col3
1   match    a1       Ted
3   c4       Smatch6  match1
5   c6                Rmatchd

Answer 1

您可以使用Series.str.contains和DataFrame.apply創建布爾掩碼，然后通過DataFrame.any檢查每行是否至少一個True並通過boolean indexing過濾：

resultdf = df1[df1.apply(lambda x: x.str.contains('match', na=False)).any(axis=1)]

或者使用in在DataFrame.applymap ：

resultdf = df1[df1.applymap(lambda x: 'match' in str(x)).any(axis=1)]

print (resultdf)
    col1     col2     col3
1  match       a1      Ted
3     c4  Smatch6   match1
4     c5       a4   Pmatch
5     c6           Rmatchd

Answer 2

向量化方法

>>> df1[df1.sum(axis=1).str.contains('match')]

    col1     col2     col3
1  match       a1      Ted
3     c4  Smatch6   match1
4     c5       a4   Pmatch
5     c6           Rmatchd

通過匹配Pandas df中所有列中的子字符串來過濾所有行

問題描述

2 個解決方案

解決方案1
0 已采納 2019-06-20 11:58:43

解決方案2
0 2019-06-20 13:00:17

通過匹配Pandas df中所有列中的子字符串來過濾所有行

問題描述

2 個解決方案

解決方案1 0 已采納 2019-06-20 11:58:43

解決方案2 0 2019-06-20 13:00:17

解決方案1
0 已采納 2019-06-20 11:58:43

解決方案2
0 2019-06-20 13:00:17