繁体   English   中英

熊猫数据框获取每日/每周/每小时数据

[英]pandas dataframe getting daily/weekly/hourly data

我有一个索引为datetime.datetime(year,month,day,hour,minute)的熊猫数据框

我希望能够使用它来获取每小时/每天/每周的数据,其中每小时数据将是框架中每小时对应的最后一个条目。

有内置的方法可以做到这一点吗? 我尝试进行案例分析,例如在每日数据的情况下,我将小时和分钟条目更改为零,但是我仍然有一个数据框,其中同一天有多个条目。 如何获得每天对应的最后一个条目?

样本数据框:

         index                x          y
2016-01-01 00:07:00-05:00   1.000      0.000
2016-01-01 00:10:00-05:00   1.000      0.000
2016-01-01 00:15:00-05:00   1.000      0.000
2016-01-01 00:16:00-05:00   1.000      0.000
2016-01-01 00:20:00-05:00   1.000      0.000
2016-01-01 00:21:00-05:00   1.000      0.000
2016-01-01 00:26:00-05:00   1.000      0.000
2016-01-01 00:31:00-05:00   1.000      0.000
2016-01-01 00:37:00-05:00   1.000      0.000
2016-01-01 00:40:00-05:00   1.000      0.000
2016-01-01 00:46:00-05:00   1.000      0.000
2016-01-01 00:51:00-05:00   1.000      0.000
2016-01-01 00:56:00-05:00   1.000      0.000
2016-01-03 19:26:00-05:00   1.000      0.000
2016-01-03 19:34:00-05:00   1.000      0.000
2016-01-03 20:02:00-05:00   1.000      0.000
2016-01-03 20:06:00-05:00   1.000      0.000
2016-01-03 20:07:00-05:00   1.000      0.000
2016-01-03 20:08:00-05:00   1.000      0.000
2016-01-03 20:10:00-05:00   1.000      0.000
2016-01-03 20:11:00-05:00   1.000      0.000
2016-01-03 20:12:00-05:00   1.000      0.000
2016-01-03 20:13:00-05:00   1.000      0.000

假设我了解您的问题(看一些示例代码会很有帮助),听起来您可以使用resample:

df.resample('D', how='sum')

它的工作方式类似于groupby或数据透视表:

DataFrame.resample(规则,方式=无,轴= 0,fill_method =无,闭合=无,标签=无,约定='开始',种类=无,偏移量=无,限制=无,基数= 0)便捷方法用于频率转换和常规时间序列数据的重采样。

参数:rule:字符串表示目标转换轴的偏移量字符串或对象:int,可选,默认值0 close:{'right','left'} bin间隔的哪一侧是闭合标签:{'right','left'}使用约定:{'start','end','s','e'}来标记存储桶的哪个边沿标签loffset:timedelta调整重新采样的时间标签基数:int,默认0对于平均细分1天的频率,汇总间隔的“来源”。 例如,对于“ 5min”频率,基数范围可以从0到4。默认值为0

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM