簡體   English   中英

在 R 中拆分小時時間序列

[英]Splitting hourly time series in R

我正在嘗試使用 R 將時間序列數據集拆分為訓練集和測試集。

數據集結構如下:

Date (format = %Y-%m-%d)     | Hour (24 H format) |       Value

         2018-09-23                    15                 12345

我已使用以下代碼將此數據集轉換為時間序列格式:


tt <- ts(df$Value,start=c(2018,09,00:00),frequency=24*365)

在此之后,我嘗試使用以下代碼將系列拆分為訓練和測試集中:

y_train <- window(tt, c(2018,09), c(2020,05)

y_test <- window(tt, c(2020,06))

但是測試集只包含兩個觀察值(而不是 1488 個值)。

我怎么解決這個問題?

例如,對於 nrow(df) = 200

tt <- ts(df$Value, frequency = 24, start = 1)        

y_train <- ts(tt[1:140], frequency=24) #70%
y_test <- ts(tt[141:200], frequency=24) #30%

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM