[英]Pandas groupby inherits groups from parent dataframe?
我正在尝试按分类变量installation_id
进行分组。 出于某种原因, groupby 似乎包括不在数据帧本身中的组。 例如:
df.groupby('installation_id').size() # Length of each group
installation_id
0001e90f 0
000447c4 0
0006a69f 16
0006c192 7
0009a5a9 0
..
我不希望任何组有 0 行。
这个数据帧是作为更大数据帧的子集制作的,所以我认为它是从更大的数据帧继承组? 如何防止这种情况发生,以便获得预期的结果?
我在分组之前尝试过df = df.copy()
,这没有区别。
感谢您的帮助,我对此比较陌生!
这是通过分类数据分组的一个特征。
而是使用:
df.groupby(df['installation_id'].to_numpy()).size()
或者来自 ALollz 的更简单(如果 ALollz 发布答案,将删除)
df.groupby('installation_id', observed=True).size()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.