[英]Resampling - Pandas Python
我正在尝试使用 python 预测零售销售时间序列。 数据集包含以下属性,[Order date Ship mode Segment Customer ID Category Product ID Product name Sales Quantity Discount Profit]。 在这里,我导入了数据集,并使用时间序列数据进行了索引
prdct1 = prdct1.groupby('Order Date')['Sales'].sum().reset_index()
prdct1 = prdct1.set_index('Order Date')
prdct1.index
已为上述代码显示日期时间索引。 当我尝试将每个月初的平均每日销售额重新采样为时间戳时,
y = prdct1['Sales'].resample('MS').mean()
我收到以下错误,
Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'Index'
有人可以帮忙吗?
我认为您需要DatetimeIndex
通过在您的解决方案之前转换列Order Date
,还应该省略带有reset_index
的set_index
:
prdct1['Order Date'] = pd.to_datetime(prdct1['Order Date'])
prdct1 = prdct1.groupby('Order Date')['Sales'].sum()
接着:
y = prdct1.resample('MS').mean().reset_index()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.