繁体   English   中英

重采样 - Pandas Python

[英]Resampling - Pandas Python

我正在尝试使用 python 预测零售销售时间序列。 数据集包含以下属性,[Order date Ship mode Segment Customer ID Category Product ID Product name Sales Quantity Discount Profit]。 在这里,我导入了数据集,并使用时间序列数据进行了索引

prdct1 = prdct1.groupby('Order Date')['Sales'].sum().reset_index()
prdct1 = prdct1.set_index('Order Date')
prdct1.index

已为上述代码显示日期时间索引。 当我尝试将每个月初的平均每日销售额重新采样为时间戳时,

y = prdct1['Sales'].resample('MS').mean()

我收到以下错误,

Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'Index'

有人可以帮忙吗?

我认为您需要DatetimeIndex通过在您的解决方案之前转换列Order Date ,还应该省略带有reset_indexset_index

prdct1['Order Date'] = pd.to_datetime(prdct1['Order Date'])
prdct1 = prdct1.groupby('Order Date')['Sales'].sum()

接着:

y = prdct1.resample('MS').mean().reset_index()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM