熊猫数据框获取每日/每周/每小时数据

Question

我有一个索引为datetime.datetime（year，month，day，hour，minute）的熊猫数据框

我希望能够使用它来获取每小时/每天/每周的数据，其中每小时数据将是框架中每小时对应的最后一个条目。

有内置的方法可以做到这一点吗？ 我尝试进行案例分析，例如在每日数据的情况下，我将小时和分钟条目更改为零，但是我仍然有一个数据框，其中同一天有多个条目。 如何获得每天对应的最后一个条目？

样本数据框：

         index                x          y
2016-01-01 00:07:00-05:00   1.000      0.000
2016-01-01 00:10:00-05:00   1.000      0.000
2016-01-01 00:15:00-05:00   1.000      0.000
2016-01-01 00:16:00-05:00   1.000      0.000
2016-01-01 00:20:00-05:00   1.000      0.000
2016-01-01 00:21:00-05:00   1.000      0.000
2016-01-01 00:26:00-05:00   1.000      0.000
2016-01-01 00:31:00-05:00   1.000      0.000
2016-01-01 00:37:00-05:00   1.000      0.000
2016-01-01 00:40:00-05:00   1.000      0.000
2016-01-01 00:46:00-05:00   1.000      0.000
2016-01-01 00:51:00-05:00   1.000      0.000
2016-01-01 00:56:00-05:00   1.000      0.000
2016-01-03 19:26:00-05:00   1.000      0.000
2016-01-03 19:34:00-05:00   1.000      0.000
2016-01-03 20:02:00-05:00   1.000      0.000
2016-01-03 20:06:00-05:00   1.000      0.000
2016-01-03 20:07:00-05:00   1.000      0.000
2016-01-03 20:08:00-05:00   1.000      0.000
2016-01-03 20:10:00-05:00   1.000      0.000
2016-01-03 20:11:00-05:00   1.000      0.000
2016-01-03 20:12:00-05:00   1.000      0.000
2016-01-03 20:13:00-05:00   1.000      0.000

Answer 1

假设我了解您的问题（看一些示例代码会很有帮助），听起来您可以使用resample：

df.resample('D', how='sum')

它的工作方式类似于groupby或数据透视表：

DataFrame.resample（规则，方式=无，轴= 0，fill_method =无，闭合=无，标签=无，约定='开始'，种类=无，偏移量=无，限制=无，基数= 0）便捷方法用于频率转换和常规时间序列数据的重采样。

参数：rule：字符串表示目标转换轴的偏移量字符串或对象：int，可选，默认值0 close：{'right'，'left'} bin间隔的哪一侧是闭合标签：{'right'，'left'}使用约定：{'start'，'end'，'s'，'e'}来标记存储桶的哪个边沿标签loffset：timedelta调整重新采样的时间标签基数：int，默认0对于平均细分1天的频率，汇总间隔的“来源”。 例如，对于“ 5min”频率，基数范围可以从0到4。默认值为0

熊猫数据框获取每日/每周/每小时数据

问题描述

1 个解决方案

解决方案1
2 已采纳 2016-11-06 04:25:23

熊猫数据框获取每日/每周/每小时数据

问题描述

1 个解决方案

解决方案1 2 已采纳 2016-11-06 04:25:23

解决方案1
2 已采纳 2016-11-06 04:25:23