[英]Aggregation of several columns in pandas
我在數據框df中有以下數據:
VALUE COUNT REGION ID
235 15 LP 139
355 59 LP 102
421 8 LP 127
427 227 LP 90
439 4 LP 133
235 45 UP 139
355 231 UP 102
421 756 UP 127
427 23 UP 90
439 76 UP 133
我想合並數據框,以便合並具有常見“ VALUE”的行。 他們的數量應該加起來。 但是,REGION列不必包含在最終數據框中。 我嘗試了以下方法:
df.groupby(['VALUE'])['COUNT'].sum()
如何獲取它以返回所有列(REGION除外)?
您可以告訴aggregate
對多個列執行多個操作。
您沒有提及要對ID
列進行的操作,因此我在這里首先介紹。 不能求和的列通常會被靜默刪除,這里就是這種情況。
In [51]: df.groupby('VALUE').aggregate({'COUNT':np.sum, 'ID':lambda x:x.iloc[0]})
Out[51]:
COUNT ID
VALUE
235 60 139
355 290 102
421 764 127
427 250 90
439 80 133
(通常,groupby的文檔是您將閱讀的有關熊貓恕我直言的最有用的信息之一)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.