繁体   English   中英

在python熊猫中重新编码数据

[英]recoding data in python pandas

所有,

我有一个每小时的时间序列数据。 见下文:

2014-01-01 00:00:00     96.8 
2014-01-01 01:00:00     91.3 
2014-01-01 02:00:00     97.8 
2014-01-01 03:00:00     77.0
2014-01-01 04:00:00    132.7
2014-01-01 05:00:00    188.1
2014-01-01 06:00:00    141.1
2014-01-01 07:00:00    115.5

我想把它纠缠成一个看起来像这样的DataFrame:

月1 2 3 4 5 6 7 8 9 ...
一月
二月数据
损伤
...

在python熊猫中做到这一点的最佳方法是什么? 该系列中的数据是预先格式化的,索引是日期时间。 这是索引:

class 'pandas.tseries.index.DatetimeIndex' 
[2014-01-01 00:00:00, ..., 2014-12-31 23:00:00] 
Length: 8760, Freq: None, Timezone: None

如果我的理解正确,那么您似乎想通过对每月时间段内的小时值求和来对数据进行重新采样。 您可以使用pandas重采样功能做到这一点:

# This will resample your data by month.
df.resample('1M').sum()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM