[英]Trouble resampling data in Pandas
我正在嘗試使用 Pandas 重新采樣天氣數據。 原始數據的間隔大約為 5 分鍾。 最后,我想導出單獨的 excel 文件,其中的數據以 5 分鍾、15 分鍾和 1 小時的間隔重新采樣。
我已成功將“時間”列設置為日期時間索引,但是當我嘗試重新采樣時,我不斷收到“數據錯誤:沒有要聚合的數字類型”
我也試過用 converters={'TemperatureF':int...etc 導入原始的 excel 文件
#Open Excel File With Original Timestamps
xlsx = pd.ExcelFile('IDLWeaterData_OriginalTime.xlsx')
df = pd.read_excel(xlsx)
print ('File read successfully')
# Set 'Time' Column as dataframe index
df.set_index(pd.DatetimeIndex(pd.to_datetime(df.Time)), inplace=True)
df.drop(['Time'],axis=1)
#Resample to 5 minute intervals
clean5 = df.resample('5min').mean()
任何對導致此問題的原因的見解都會很棒! 謝謝!
以下是數據示例:
TemperatureF DewpointF PressureIn Humidity HourlyPrecipIn dailyrainin SolarRadiationWatts/m^2
2016-01-01 00:04:00 31.9 22.2 30.51 67 0.00 0.00 0
2016-01-01 00:10:00 32.2 22.5 30.52 67 0.00 0.00 0
2016-01-01 00:16:00 32.5 23.1 30.51 68 0.00 0.00 0
這就是您的數據正在發生的事情。
要解決這個問題:
>>> df[df.Time.notnull()].set_index('Time').astype(float).resample('5min')
TemperatureF DewpointF PressureIn Humidity HourlyPrecipIn
dailyrainin SolarRadiationWatts/m^2
Time
2016-01-01 00:00:00 31.9 22.20 30.51 67 0 0 0
2016-01-01 00:05:00 NaN NaN NaN NaN NaN NaN NaN
2016-01-01 00:10:00 32.2 22.50 30.52 67 0 0 0
2016-01-01 00:15:00 32.5 23.10 30.51 68 0 0 0
2016-01-01 00:20:00 32.5 22.80 30.52 67 0 0 0
...
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.