繁体   English   中英

Pandas 数据框,groupBy 聚合多列和多行

[英]Pandas dataframe, groupBy aggregate multiple columns and rows

我有一个如下所示的 Pandas DataFrame:

  supply_area transaction_date     price
0       54.98       2006-03-31   48500.0
0       54.98       2006-04-30   48500.0
0       54.98       2006-05-31   48500.0
1       67.28       2006-01-31   54500.0
1       67.28       2006-02-28   54500.0
1       67.28       2006-03-31   54500.0

我想按 supply_area 与一个连接 transaction_date 和 price 的列进行分组,如下所示:

  supply_area transaction_date_price     price
0       54.98       2006-03-31,48500.0,2006-04-30,48500.0,2006-05-31,48500.0
1       67.28       2006-01-31,54500.0,2006-02-28,54500.0,2006-03-31,54500.0

我已经尝试过这个和其他一些事情,但它不起作用。

df = df.groupby('supply_area').agg(
                {'supply_area': 'first', 'transaction_date': ','.join, 'price': ','.join})

我对 python 和 pandas lib 还很陌生,所以我不确定我想要的是否可行。

提前致谢!

您可以使用第一个连接创建一个新列(此处称为“joined”,但任何名称都可以),然后在groupby上连接:

df['joined'] = (df['transaction_date'] + ',' + df['price'].astype(str))
df.groupby('supply_area', as_index=False)['joined'].apply(','.join)

输出:

   supply_area                                              joined
0        54.98  2006-03-31,48500,2006-04-30,48500,2006-05-31,48500
1        67.28  2006-01-31,54500,2006-02-28,54500,2006-03-31,54500

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM