[英]Pandas groupby columns without multiindex
我有一個包含一個月內火車站數據的數據框,其中三個是索引:Station、Date、Hour。 我可以看起來像這樣:
Station Date Hour Passengers
Berlin HBF 2012-12-24 12:00 1000
Berlin HBF 2012-12-24 13:00 2000
Berlin HBF 2012-12-24 14:00 1000
Berlin HBF 2012-12-24 15:00 1000
....
Stuttgart 2012-12-24 12:00 500
由於我只對一個月內某個站的總和感興趣,所以我想按站、日期和小時分組,以便最終結果如下所示:
Station Passengers
Berlin HBF 4000
....
Stuttgart 500
但是我無法讓熊貓使用這個解決方案,我試過: byStation = traindata.groupby(['Station', 'Date', 'Hour']).agg(np.sum()) 但這只是返回一個多索引,與所有行...
看起來您只想按“Station”分組並對“Passangers”列進行求和。 此處不需要多索引。 您的解決方案將創建一個,但由於它與您的原始數據相同,因此它毫無用處。
這個應該有效:
traindata.groupby("Station").Passengers.sum()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.