Pandas 數據框，groupBy 聚合多列和多行

Question

我有一個如下所示的 Pandas DataFrame：

  supply_area transaction_date     price
0       54.98       2006-03-31   48500.0
0       54.98       2006-04-30   48500.0
0       54.98       2006-05-31   48500.0
1       67.28       2006-01-31   54500.0
1       67.28       2006-02-28   54500.0
1       67.28       2006-03-31   54500.0

我想按 supply_area 與一個連接 transaction_date 和 price 的列進行分組，如下所示：

  supply_area transaction_date_price     price
0       54.98       2006-03-31,48500.0,2006-04-30,48500.0,2006-05-31,48500.0
1       67.28       2006-01-31,54500.0,2006-02-28,54500.0,2006-03-31,54500.0

我已經嘗試過這個和其他一些事情，但它不起作用。

df = df.groupby('supply_area').agg(
                {'supply_area': 'first', 'transaction_date': ','.join, 'price': ','.join})

我對 python 和 pandas lib 還很陌生，所以我不確定我想要的是否可行。

提前致謝！

Answer 1

您可以使用第一個連接創建一個新列（此處稱為“joined”，但任何名稱都可以），然后在groupby上連接：

df['joined'] = (df['transaction_date'] + ',' + df['price'].astype(str))
df.groupby('supply_area', as_index=False)['joined'].apply(','.join)

輸出：

   supply_area                                              joined
0        54.98  2006-03-31,48500,2006-04-30,48500,2006-05-31,48500
1        67.28  2006-01-31,54500,2006-02-28,54500,2006-03-31,54500

Pandas 數據框，groupBy 聚合多列和多行

問題描述

1 個解決方案

解決方案1
0 已采納 2021-07-16 09:11:40

Pandas 數據框，groupBy 聚合多列和多行

問題描述

1 個解決方案

解決方案1 0 已采納 2021-07-16 09:11:40

解決方案1
0 已采納 2021-07-16 09:11:40