繁体   English   中英

Python:当多行满足唯一条件时过滤数据框中的行

[英]Python: Filter rows in data frame when multiple rows meet a unique condition

我有一个类似于以下的数据集:

    dt = {'A': [0,0,0,1], 
          'B': [0, 2,0,3],
          'C': [0,0,0,4],
          'D': [0,5,0,6]}
    dt = pd.DataFrame(dt)

我的目标是在该行的列 ['A', 'B','C', 'D'] 全部为零时过滤所有行。 在实际数据集中而不是 4 列中,我有超过 20 列 所以下面的解决方案是不可行的:

    dt = dt[(dt['A'] == 0) & (dt['B'] == 0) & (dt['C'] == 0) & (dt['D'] == 0)]

所以我想出了以下解决方案:

    dt['new'] = np.nan
    lst = [0,1,2,3]

    for i in range(len(dt)):
        dt.iloc[i, 4] = all(dt.iloc[i, lst] == 0) 

最后我可以根据“新”列进行过滤。

我正在寻找一个更有效的解决方案,最好是没有循环的东西,任何帮助将不胜感激。

您可以尝试使用DataFrame.eqDataFrame.allboolean indexing

dt[dt.eq(0).all(1)]

   A  B  C  D
0  0  0  0  0
2  0  0  0  0

另一个想法是使用np.anyDataFrame.any作为 boolean 掩码

dt[~dt.any(1)] # @Sayandip Dutta's answer in the comments
dt[~np.any(dt, axis=1)]

试试这个, DataFrame.sum(axis=1)

dt[dt.sum(axis=1).eq(0)]

   A  B  C  D
0  0  0  0  0
2  0  0  0  0

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM