簡體   English   中英

帶有聚合的 Python itertools groupby

[英]Python itertools groupby with aggregate

我試圖根據它出現的順序(時間戳)對列進行分組,並同時在小組內的其他變量上找到聚合(平均值)。 我可以成功分組但無法聚合

這是我的示例輸入:

Date        T/F X1
12/02/19    T   10
12/02/19    T   20
12/02/19    F   15
12/02/19    T   12
12/03/19    F   10
12/03/19    F   20
12/03/19    T   30
12/04/19    T   40

預期產量

Date        T/F X1  Count
12/02/19    T   15  2
12/02/19    F   15  1
12/02/19    T   12  1
12/03/19    F   15  2
12/03/19    T   35  2

這是我正在使用的代碼,哪些組並給我每個組的計數,我如何在該組內獲得 X1 的平均值

import itertools 
for (key,group) in itertools.groupby(df['T/F']): 
    print (key, len(list(group))) 

謝謝您的幫助!

您可以使用函數groupby

df1 = df.assign(Count=np.nan).\
groupby(df['T/F'].ne(df['T/F'].shift()).cumsum(), as_index=False).\
agg({'Date': 'first', 'T/F': 'first', 'X1': 'mean', 'Count': 'size'})

print(df1)

輸出:

       Date T/F  X1  Count
0  12/02/19   T  15      2
1  12/02/19   F  15      1
2  12/02/19   T  12      1
3  12/03/19   F  15      2
4  12/03/19   T  35      2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM