簡體   English   中英

沒有多索引的 Pandas groupby 列

[英]Pandas groupby columns without multiindex

我有一個包含一個月內火車站數據的數據框,其中三個是索引:Station、Date、Hour。 我可以看起來像這樣:

Station    Date       Hour    Passengers 
Berlin HBF 2012-12-24 12:00   1000 
Berlin HBF 2012-12-24 13:00   2000  
Berlin HBF 2012-12-24 14:00   1000  
Berlin HBF 2012-12-24 15:00   1000  
....
Stuttgart 2012-12-24 12:00    500  

由於我只對一個月內某個站的總和感興趣,所以我想按站、日期和小時分組,以便最終結果如下所示:

Station    Passengers 
Berlin HBF 4000 
....
Stuttgart  500  

但是我無法讓熊貓使用這個解決方案,我試過: byStation = traindata.groupby(['Station', 'Date', 'Hour']).agg(np.sum()) 但這只是返回一個多索引,與所有行...

看起來您只想按“Station”分組並對“Passangers”列進行求和。 此處不需要多索引。 您的解決方案將創建一個,但由於它與您的原始數據相同,因此它毫無用處。

這個應該有效:

traindata.groupby("Station").Passengers.sum()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM