熊猫删除具有不同列值的不同行

Question

我有 DataFrame df = pd.DataFrame({'col1': ["a","b","c","d","e", "e"], 'col2': [1,3,3,2,6,6], 'col3': [1,2,3,4,5,6]})看起来像

输入：

     col1 col2 col3
    0   a   1   1
    1   b   3   2
    2   c   3   3
    3   d   2   4
    4   e   6   5
    5   e   6   6

我想从“col1”中删除在“col2”中共享一个共同值的行，除了相同的值，即字母“e”。 我希望它是“col1”中只有一个值可以=“col2”中唯一一个值的地方预期的输出看起来像......

输出：

     col1 col2 col3
    0   a   1   1
    3   d   2   4
    4   e   6   5
    5   e   6   6

这样做的过程是什么？

Answer 1

根据你的描述，我的理解如下：

如果两行在col2具有相同的值， col2它们都将被删除。
如果两行在col2具有相同的值但在col1具有相同的值，则您希望保留它们。
不属于以上两个类别的所有其他行，您要保留。

这可以通过以下方式实现：

df[np.logical_or(~df.duplicated('col2', keep = False),df.duplicated('col1', keep = False)) ]

Answer 2

您可以执行以下操作：

df[df.col1.duplicated(keep=False) | ~df.col2.duplicated(keep=False)]

输出

| col1   |   col2 |   col3 |
|:-------|-------:|-------:|
| a      |      1 |      1 |
| d      |      2 |      4 |
| e      |      6 |      5 |
| e      |      6 |      6 |

熊猫删除具有不同列值的不同行

问题描述

2 个解决方案

解决方案1
2 已采纳 2020-08-31 16:31:06

解决方案2
2 2020-08-31 16:35:33

熊猫删除具有不同列值的不同行

问题描述

2 个解决方案

解决方案1 2 已采纳 2020-08-31 16:31:06

解决方案2 2 2020-08-31 16:35:33

解决方案1
2 已采纳 2020-08-31 16:31:06

解决方案2
2 2020-08-31 16:35:33