[英]Resample a pandas dataframe with multiple variables
我有一个长格式的数据帧,其中包含多个变量的 15 分钟间隔数据。 如果我应用重采样方法来获得平均每日值,我将获得给定时间间隔内所有变量的平均值(而不是速度、距离的平均值)。
有谁知道如何重新采样数据框并保留 2 个变量?
注意:下面的代码包含一个长格式的示例数据帧,我的真实示例从 csv 加载数据,并且变量具有不同的时间间隔和频率,因此我不能简单地以宽格式重新采样数据帧。
import pandas as pd
import numpy as np
dti = pd.date_range('2015-01-01', '2015-12-31', freq='15min')
df = pd.DataFrame(index = dti)
# Average speed in miles per hour
df['speed'] = np.random.randint(low=0, high=60, size=len(df.index))
# Distance in miles (speed * 0.5 hours)
df['distance'] = df['speed'] * 0.25
df.reset_index(inplace=True)
df2 = df.melt (id_vars = 'index')
df3 = df2.resample('d', on='index').mean()
IUC:
>>> df.groupby(df.index.date).mean()
speed distance
2015-01-01 29.562500 7.390625
2015-01-02 31.885417 7.971354
2015-01-03 30.895833 7.723958
2015-01-04 30.489583 7.622396
2015-01-05 28.500000 7.125000
... ... ...
2015-12-27 28.552083 7.138021
2015-12-28 29.437500 7.359375
2015-12-29 29.479167 7.369792
2015-12-30 28.864583 7.216146
2015-12-31 48.000000 12.000000
[365 rows x 2 columns]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.