数据框根据列的特定条件删除行

Question

这是df的一部分：

   NUMBER         MONEY
    12345           20
    12345          -20
    123456          10
    678910          7.6
    123457          3
    678910         -7.6

我想删除具有相同NUMBER但金额相反的行。

理想的结果如下：

   NUMBER         MONEY

    123456          10

    123457          3

Answer 1

如果一个组中只有2行，请使用：

df[df.groupby('NUMBER').MONEY.transform('sum').ne(0)]

   NUMBER  MONEY
2  123456   10.0
4  123457    3.0

Answer 2

尝试这个，

>>> df[~df.assign(MONEY=df.MONEY.abs()).duplicated(keep=False)]

输出：

   NUMBER  MONEY
2  123456   10.0
4  123457    3.0

从评论（通过@piRSquared）：

通过使用assign，将新列添加到df ，随后的drop_duplicates同时考虑了NUMBER和MONEY的绝对值

df[~df.assign(MONEY=df.MONEY.abs()).duplicated(keep=False)]

数据框根据列的特定条件删除行

问题描述

2 个解决方案

解决方案1
1 2019-07-05 16:29:08

解决方案2
1 2019-07-05 16:30:17

数据框根据列的特定条件删除行

问题描述

2 个解决方案

解决方案1 1 2019-07-05 16:29:08

解决方案2 1 2019-07-05 16:30:17

解决方案1
1 2019-07-05 16:29:08

解决方案2
1 2019-07-05 16:30:17