根据 groupby 条件删除 Pandas 数据帧行

Question

我有一个如下所示的熊猫数据框

    text    name    target
0   str1    name1   1
1   str1    name2   3
2   str1    name2   3
3   str2    name1   2
4   str2    name1   2
5   str2    name1   4
6   str3    name3   3

我需要删除那些只出现一次目标类的行。 在这种情况下，我需要删除行索引0和5 ，因为1和4只出现一次。

我查看了这篇文章并尝试了以下内容：

df[df.groupby(['target']).transform('sum') > 1]

但这似乎不起作用。 任何人都可以请建议吗？

Answer 1

希望这足够了：过滤掉目标计数不大于 1 的行

df.groupby('target').filter(lambda x: x.count().gt(1).any())

    text    name    target
1   str1    name2   3
2   str1    name2   3
3   str2    name1   2
4   str2    name1   2
6   str3    name3   3

Answer 2

您可以使用value_counts ，映射回来和过滤器：

print(df[df.target.map(df.target.value_counts()).gt(1)])

输出：

   text   name  target
1  str1  name2       3
2  str1  name2       3
3  str2  name1       2
4  str2  name1       2
6  str3  name3       3

根据 groupby 条件删除 Pandas 数据帧行

问题描述

2 个解决方案

解决方案1
1 2020-02-28 03:24:33

解决方案2
1 已采纳 2020-02-28 03:33:16

根据 groupby 条件删除 Pandas 数据帧行

问题描述

2 个解决方案

解决方案1 1 2020-02-28 03:24:33

解决方案2 1 已采纳 2020-02-28 03:33:16

解决方案1
1 2020-02-28 03:24:33

解决方案2
1 已采纳 2020-02-28 03:33:16