[英]Splitting hourly time series in R
我正在嘗試使用 R 將時間序列數據集拆分為訓練集和測試集。
數據集結構如下:
Date (format = %Y-%m-%d) | Hour (24 H format) | Value
2018-09-23 15 12345
我已使用以下代碼將此數據集轉換為時間序列格式:
tt <- ts(df$Value,start=c(2018,09,00:00),frequency=24*365)
在此之后,我嘗試使用以下代碼將系列拆分為訓練和測試集中:
y_train <- window(tt, c(2018,09), c(2020,05)
y_test <- window(tt, c(2020,06))
但是測試集只包含兩個觀察值(而不是 1488 個值)。
我怎么解決這個問題?
例如,對於 nrow(df) = 200
tt <- ts(df$Value, frequency = 24, start = 1)
y_train <- ts(tt[1:140], frequency=24) #70%
y_test <- ts(tt[141:200], frequency=24) #30%
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.