根據 time freq 和 groupby 獲取整個數據幀

Question

我試圖根據 dataframe 的時間頻率進行分組。 我可以獲取所有列，而不僅僅是 group by 中的指定列。

代碼：

df.columns = ['time', 'age', 'salary', 'amount','university', 'gender', 'place', 'education']

東風：

time    age salary  amount  university  gender  place   education
12/6/2021   24  33333   232323  SK  M   US  BE
12/6/2021   24  33333   232323  SK  M   US  BE
12/8/2021   30  23656   9496    SE  F   UK  BARC
12/9/2021   34  65652   26266   DE  M   UK  BTECH
12/6/2021   25  89893   2652    NK  F   GER BSC
12/6/2021   25  89893   2652    NK  F   GER BSC
12/8/2021   70  445464  78989   SE  F   UK  BARC
12/9/2021   45  65656   225415  NK  F   GER BTECH
12/6/2021   29  5996    3232    NK  M   CAN BTECH

full_data = data.groupby([pd.Grouper(key='time', freq='4min'),'age', 'salary', 'amount','university']).size().reset_index(name='counts')

預期的：

time    age salary  amount  university  gender  place   education   counts
12/6/2021   24  33333   232323  SK         M    US  BE  2
12/8/2021   30  23656   9496    SE         F    UK  BARC    1
12/9/2021   34  65652   26266   DE         M    UK  BTECH   1
12/6/2021   25  89893   2652    NK         F    GER BSC 2
12/8/2021   70  445464  78989   SE         F    UK  BARC    1
12/9/2021   45  65656   225415  NK         F    GER BTECH   1
12/6/2021   29  5996    3232    NK         M    CAN BTECH   1

上述代碼的結果只有 5 列。 有沒有辦法得到所有的列

Answer 1

IIUC 用途：

data['counts'] = data.groupby([pd.Grouper(key='time', freq='4min'),'age', 'salary', 'amount','university'])['age'].transform('size')

df = data.drop_duplicates(['age', 'salary', 'amount','university'])

根據 time freq 和 groupby 獲取整個數據幀

問題描述

1 個解決方案

解決方案1
0 2021-12-07 08:51:50

根據 time freq 和 groupby 獲取整個數據幀

問題描述

1 個解決方案

解決方案1 0 2021-12-07 08:51:50

解決方案1
0 2021-12-07 08:51:50