[英]Pandas groupby inherits groups from parent dataframe?
我正在嘗試按分類變量installation_id
進行分組。 出於某種原因, groupby 似乎包括不在數據幀本身中的組。 例如:
df.groupby('installation_id').size() # Length of each group
installation_id
0001e90f 0
000447c4 0
0006a69f 16
0006c192 7
0009a5a9 0
..
我不希望任何組有 0 行。
這個數據幀是作為更大數據幀的子集制作的,所以我認為它是從更大的數據幀繼承組? 如何防止這種情況發生,以便獲得預期的結果?
我在分組之前嘗試過df = df.copy()
,這沒有區別。
感謝您的幫助,我對此比較陌生!
這是通過分類數據分組的一個特征。
而是使用:
df.groupby(df['installation_id'].to_numpy()).size()
或者來自 ALollz 的更簡單(如果 ALollz 發布答案,將刪除)
df.groupby('installation_id', observed=True).size()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.