繁体   English   中英

没有多索引的 Pandas groupby 列

[英]Pandas groupby columns without multiindex

我有一个包含一个月内火车站数据的数据框,其中三个是索引:Station、Date、Hour。 我可以看起来像这样:

Station    Date       Hour    Passengers 
Berlin HBF 2012-12-24 12:00   1000 
Berlin HBF 2012-12-24 13:00   2000  
Berlin HBF 2012-12-24 14:00   1000  
Berlin HBF 2012-12-24 15:00   1000  
....
Stuttgart 2012-12-24 12:00    500  

由于我只对一个月内某个站的总和感兴趣,所以我想按站、日期和小时分组,以便最终结果如下所示:

Station    Passengers 
Berlin HBF 4000 
....
Stuttgart  500  

但是我无法让熊猫使用这个解决方案,我试过: byStation = traindata.groupby(['Station', 'Date', 'Hour']).agg(np.sum()) 但这只是返回一个多索引,与所有行...

看起来您只想按“Station”分组并对“Passangers”列进行求和。 此处不需要多索引。 您的解决方案将创建一个,但由于它与您的原始数据相同,因此它毫无用处。

这个应该有效:

traindata.groupby("Station").Passengers.sum()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM