根据汇总值从数据框中选择行

Question

I have a DataFrame of patient information that is keyed by patient/visit. 我有一个按患者/就诊方式输入的患者信息的数据框。 I want to select all patient/visit data for patients that have only one visit. 我想为仅一次就诊的患者选择所有患者/就诊数据。 In general I'd like to be able to select data based on any grouped and aggregated value of that data. 通常，我希望能够根据该数据的任何分组和汇总值来选择数据。

My current way to do it is to merge, but that is rather cumbersome. 我目前的做法是合并，但这很麻烦。

dfg = dfmn.groupby(['pt_studyid']).size().to_frame("count").reset_index()
dfgu = dfg[dfg['count']>1]
dfmn_filt = dfgu.merge(dfmn, on=['pt_studyid']).drop('count', 1)

Is there a cleaner way? 有没有更清洁的方法？

Answer 1

Use the filter method of the DataFrameGroupBy object 使用DataFrameGroupBy对象的filter方法

dfmn.groupby('pt_studyid').filter(lambda x: len(x) > 1)

Example 例

dfmn = pd.DataFrame(dict(pt_studyid=list('AAAABBBCDEFFF'), val=range(13)))
dfmn

   pt_studyid  val
0           A    0
1           A    1
2           A    2
3           A    3
4           B    4
5           B    5
6           B    6
7           C    7
8           D    8
9           E    9
10          F   10
11          F   11
12          F   12

Filter 过滤

print(dfmn.groupby('pt_studyid').filter(lambda x: len(x) > 1))

   pt_studyid  val
0           A    0
1           A    1
2           A    2
3           A    3
4           B    4
5           B    5
6           B    6
10          F   10
11          F   11
12          F   12

根据汇总值从数据框中选择行

问题描述

1 个解决方案

解决方案1
0 已采纳 2017-04-26 19:53:51

根据汇总值从数据框中选择行

问题描述

1 个解决方案

解决方案1 0 已采纳 2017-04-26 19:53:51

解决方案1
0 已采纳 2017-04-26 19:53:51