仅在 df pandas 中显示特定组

Question

您好，我需要关注表中的特定组。

这是一个例子：

groups col1 
A 3
A 4
A 2
A 1
B 3
B 3
B 4
C 2
D 4
D 3

我只想显示包含 3 和 4 但没有其他数字的组。 在这里我应该得到：

groups col1 
B 3
B 3
B 4
D 4
D 3

Answer 1

这里有两种可能的方法 - 通过Series.isin测试成员资格，然后通过GroupBy.transform和GroupBy.all获取所有具有所有True的组，最后通过boolean indexing过滤：

df1 = df[df['col1'].isin([3,4]).groupby(df['groups']).transform('all')]
print (df1)
  groups  col1
4      B     3
5      B     3
6      B     4
8      D     4
9      D     3

另一种方法是首先获取所有组值，其中NOT包含值3,4并传递给另一个具有反转掩码的isin函数：

df1 = df[~df['groups'].isin(df.loc[~df['col1'].isin([3,4]), 'groups'])]
print (df1)
  groups  col1
4      B     3
5      B     3
6      B     4
8      D     4
9      D     3

Answer 2

我们也可以使用GroupBy.filter ：

new_df=df.groupby('groups').filter(lambda x: x.col1.isin([3,4]).all() )
print(new_df)

  groups  col1
4      B     3
5      B     3
6      B     4
8      D     4
9      D     3

从 lambda 函数中删除Series.isin的替代方法：

df['aux']=df['col1'].isin([3,4])
df.groupby('groups').filter(lambda x: x.aux.all()).drop('aux',axis=1)

Answer 3

使用df.loc[]然后按正常逻辑搜索应该可以工作。

import pandas as pd

data = [['A', 3],
        ['A', 4],
        ['A', 2],
        ['A', 1],
        ['B', 3],
        ['B', 3],
        ['B', 4],
        ['C', 2],
        ['D', 4],
        ['D', 3]]
df = pd.DataFrame(data, columns=["col1", "col2"])

df = df.loc[df["col2"] >= 3]
print(df.head())

仅在 df pandas 中显示特定组

问题描述

3 个解决方案

解决方案1
4 2019-11-29 13:52:00

解决方案2
1 2019-11-29 13:59:46

解决方案3
0 2019-11-29 14:01:28

仅在 df pandas 中显示特定组

问题描述

3 个解决方案

解决方案1 4 2019-11-29 13:52:00

解决方案2 1 2019-11-29 13:59:46

解决方案3 0 2019-11-29 14:01:28

解决方案1
4 2019-11-29 13:52:00

解决方案2
1 2019-11-29 13:59:46

解决方案3
0 2019-11-29 14:01:28